अनुहार पहिचान मोडेलमा केस स्टडी
धोखाधडी पत्ता लगाउने एआई मोडेलहरूको लागि एन्टी-स्पूफिङ भिडियो डेटासेट
जालसाजी पत्ता लगाउनको लागि एआई मोडेलहरूलाई तालिम दिन वास्तविक र पुन: प्ले आक्रमण परिदृश्यहरू प्रस्तुत गर्ने २५,००० उच्च-गुणस्तरको एन्टी-स्पूफिङ भिडियो डेटासेटहरू कसरी शेपले डेलिभर गरे भनेर पत्ता लगाउनुहोस्।
परियोजना अवलोकन
ठगी पत्ता लगाउनको लागि एआई मोडेल प्रशिक्षण बढाउन डिजाइन गरिएको उच्च-गुणस्तरको, अफ-द-सेल्फ एन्टी-स्पूफिङ भिडियो डेटासेट प्रदान गर्न शेपले एक अग्रणी एआई सुरक्षा कम्पनीसँग साझेदारी गर्यो। डेटासेटमा वास्तविक र पुन: प्ले आक्रमण परिदृश्यहरू कैद गर्ने २५,००० भिडियोहरू समावेश थिए, जसले एन्टी-स्पूफिङ मोडेलहरूको लागि बलियो प्रशिक्षण डेटा सुनिश्चित गर्दछ।
प्रत्येक 12,500 सहभागीहरू दुई भिडियोहरू योगदान गरियो - एउटा वास्तविक र एउटा रिप्ले आक्रमण - रेकर्ड गरियो ७२०p वा उच्च रिजोल्युसन को फ्रेम दरको साथ २६ FPS र माथिको.
परियोजनाको लक्ष्य प्रदान गर्नु थियो प्रामाणिक र विविध डेटासेटहरू यसले एआई मोडेलहरूलाई वास्तविक र नक्कली बायोमेट्रिक भिडियोहरू बीच प्रभावकारी रूपमा छुट्याउन सक्षम बनाउनेछ, जसले गर्दा बायोमेट्रिक प्रमाणीकरण प्रणालीहरूमा ठगी जोखिम कम हुनेछ।

कुञ्जी तथ्या .्क
25,000 कुल भिडियोहरू (12,500 वास्तविक भिडियोहरू, 12,500 (आक्रमण भिडियोहरू पुन: प्ले गर्नुहोस्)
12,500 अद्वितीय
सहभागीहरू
5 जातीय समूहहरू
डेटासेटमा प्रतिनिधित्व गरिएको
चरणबद्ध डेलिभरी: 4 को ब्याचहरू 6,250 प्रत्येक भिडियो
मेटाडेटा विशेषताहरू: 12 बढाइएको डेटासेट उपयोगिताको लागि प्रमुख प्यारामिटरहरू
एन्टी-स्पुफिङ बायोमेट्रिक डेटासेट स्कोप
डेटासेट क्युरेसन: यो परियोजनाले उच्च-गुणस्तरको एन्टी-स्पूफिङ भिडियो डेटासेटहरू प्रदान गर्ने कुरामा केन्द्रित थियो जसमा समावेश थिए वास्तविक र पुन: प्ले आक्रमण भिडियोहरूमुख्य पक्षहरू समावेश:
- 12,500 सहभागीहरू योगदान गर्दै दुईवटा भिडियोहरू (१ वास्तविक, १ नक्कली)।
- रेकर्डिङ उपकरणहरूमा विविधता मोडेल अनुकूलन क्षमता बढाउन।
- सन्तुलित जातीय प्रतिनिधित्व डेटासेट समावेशीता सुनिश्चित गर्न।
मेटाडेटा सङ्कलन: प्रत्येक भिडियोको साथमा थियो १२ मेटाडेटा विशेषताहरू डेटासेट उपयोगिता बढाउन।
भिडियो डेटा सङ्कलन चुनौतीहरू
उच्च-गुणस्तरका भिडियोहरू सोर्स गर्दै जातीय रूपमा सन्तुलित डेटा वितरण कायम राख्ने।
डेटासेटको अखण्डता कायम राख्न प्रत्येक सहभागीले एउटा वास्तविक र एउटा रिप्ले आक्रमण भिडियो योगदान गर्ने कुरा सुनिश्चित गर्ने।
FPS (≥ २६), रिजोल्युसन (≥ ७२०p), र टाइमस्ट्याम्प शुद्धता (+/- ०.५ms) को लागि कडा दिशानिर्देशहरूको पालना गर्दै।
हामीले यसलाई कसरी समाधान गर्यौं
परियोजनाको आवश्यकताहरू पूरा गर्न श्यापले संरचित र उच्च-गुणस्तरको डेटासेट प्रदान गर्यो। समाधानमा समावेश थियो:
डेटासेट क्युरेसन र गुणस्तर नियन्त्रण
- 25,000 भिडियोहरू सबैतिर सङ्कलन गरिएको 4 चरणहरू अवरोधहरूबाट बच्न, स्थिर र संरचित डेटा प्रवाह सुनिश्चित गर्न।
- कडा प्रमाणीकरण प्रक्रिया अनुपालन सुनिश्चित गर्न FPS, रिजोल्युसन, र मेटाडेटा शुद्धता। अन्तिम स्वीकृति हुनुभन्दा पहिले प्रत्येक भिडियोको धेरै गुणस्तर जाँच गरियो।
- व्यापक मेटाडेटा ट्यागिङ संग १२ विशेषताहरू:
- फाइल आईडी/नाम
- आक्रमणको प्रकार (वास्तविक/रिप्ले)
- व्यक्ति आईडी
- भिडियो संकल्प
- भिडियो अवधि
- विषयको जातीयता
- विषयको लिङ्ग
- भिडियो मौलिक होस् वा नक्कली होस्
- यन्त्रको नाम/मोडेल
- बोल्ने व्यक्ति वा नबोल्ने व्यक्ति
- टाइमस्ट्याम्प सुरु हुने समय
- टाइमस्ट्याम्प समाप्ति समय
- सन्तुलित जातीय समूह वितरण: सन्तुलित जातीय प्रतिनिधित्व कायम राख्न डेटासेट सावधानीपूर्वक क्युरेट गरिएको थियो। वितरणमा हिस्पैनिक (३३%), दक्षिण एसियाली (२१%), कोकेशियन (२०%), अफ्रिकी (१५%), र पूर्वी एसियाली र मध्य पूर्वी जनसंख्या (प्रत्येकमा ६% सम्म) समावेश छन्।
- कुनै दोहोरिएका प्रविष्टिहरू छैनन् डेटासेटको विशिष्टता कायम राख्न र एआई तालिममा पूर्वाग्रहहरू रोक्न।
- जातीय विविधतापूर्ण सहभागी छनोट वास्तविक-विश्व प्रयोगकर्ता भिन्नताहरू प्रतिबिम्बित गर्ने डेटासेट सिर्जना गर्न, एआई मोडेल अनुकूलन क्षमता र निष्पक्षतामा सुधार गर्न।
- रेकर्डिङ उपकरणको भिन्नता विभिन्न वातावरणीय सेटिङहरूमा मोडेलको बलियोपन बढाउन धेरै स्मार्टफोन मोडेलहरू, क्यामेराहरू, र प्रकाश अवस्थाहरू समावेश गरिएको थियो।
परिणाम
श्यापद्वारा प्रदान गरिएको उच्च-गुणस्तरको, विविध एन्टी-स्पूफिङ भिडियो डेटासेटले क्लाइन्टलाई विभिन्न बायोमेट्रिक प्रमाणीकरण परिदृश्यहरूमा वास्तविक र स्पूफ गरिएका भिडियोहरू बीच सही रूपमा भिन्नता छुट्याउन एआई मोडेलहरूलाई तालिम दिन सक्षम बनायो। डेटासेटले निम्नमा योगदान पुर्यायो:
धोखाधडी बायोमेट्रिक आक्रमणहरू पत्ता लगाउन एआई कार्यसम्पादनमा सुधार।
विभिन्न जाति, उपकरणहरू र वातावरणीय अवस्थाहरूमा पुन: प्ले आक्रमणहरू पहिचान गर्ने मोडेलको क्षमतालाई बलियो बनायो।
डेटासेटले भविष्यमा एन्टी-स्पूफिङ मोडेलको वृद्धि र विस्तारको लागि आधारको रूपमा काम गर्दछ।
हाम्रो एआई-संचालित एन्टी-स्पूफिङ मोडेलहरूलाई बढाउनमा शेपको डेटासेटले महत्वपूर्ण भूमिका खेलेको छ। विविधता, गुणस्तर, र संरचित मेटाडेटाले बायोमेट्रिक प्रमाणीकरण प्रणालीहरूमा ठगी पत्ता लगाउने सुधारको लागि बलियो जग प्रदान गर्यो।