अनुहार पहिचान मोडेलमा केस स्टडी

धोखाधडी पत्ता लगाउने एआई मोडेलहरूको लागि एन्टी-स्पूफिङ भिडियो डेटासेट

जालसाजी पत्ता लगाउनको लागि एआई मोडेलहरूलाई तालिम दिन वास्तविक र पुन: प्ले आक्रमण परिदृश्यहरू प्रस्तुत गर्ने २५,००० उच्च-गुणस्तरको एन्टी-स्पूफिङ भिडियो डेटासेटहरू कसरी शेपले डेलिभर गरे भनेर पत्ता लगाउनुहोस्।

एन्टी-स्पुफिङ भिडियो डेटा सङ्कलन

परियोजना अवलोकन

ठगी पत्ता लगाउनको लागि एआई मोडेल प्रशिक्षण बढाउन डिजाइन गरिएको उच्च-गुणस्तरको, अफ-द-सेल्फ एन्टी-स्पूफिङ भिडियो डेटासेट प्रदान गर्न शेपले एक अग्रणी एआई सुरक्षा कम्पनीसँग साझेदारी गर्‍यो। डेटासेटमा वास्तविक र पुन: प्ले आक्रमण परिदृश्यहरू कैद गर्ने २५,००० भिडियोहरू समावेश थिए, जसले एन्टी-स्पूफिङ मोडेलहरूको लागि बलियो प्रशिक्षण डेटा सुनिश्चित गर्दछ।

प्रत्येक 12,500 सहभागीहरू दुई भिडियोहरू योगदान गरियो - एउटा वास्तविक र एउटा रिप्ले आक्रमण - रेकर्ड गरियो ७२०p वा उच्च रिजोल्युसन को फ्रेम दरको साथ २६ FPS र माथिको.

परियोजनाको लक्ष्य प्रदान गर्नु थियो प्रामाणिक र विविध डेटासेटहरू यसले एआई मोडेलहरूलाई वास्तविक र नक्कली बायोमेट्रिक भिडियोहरू बीच प्रभावकारी रूपमा छुट्याउन सक्षम बनाउनेछ, जसले गर्दा बायोमेट्रिक प्रमाणीकरण प्रणालीहरूमा ठगी जोखिम कम हुनेछ।

एन्टी-स्पुफिङ भिडियो डेटा सङ्कलन

कुञ्जी तथ्या .्क

25,000 कुल भिडियोहरू (12,500 वास्तविक भिडियोहरू, 12,500 (आक्रमण भिडियोहरू पुन: प्ले गर्नुहोस्)

12,500 अद्वितीय
सहभागीहरू

5 जातीय समूहहरू
डेटासेटमा प्रतिनिधित्व गरिएको

चरणबद्ध डेलिभरी: 4 को ब्याचहरू 6,250 प्रत्येक भिडियो

मेटाडेटा विशेषताहरू: 12 बढाइएको डेटासेट उपयोगिताको लागि प्रमुख प्यारामिटरहरू

एन्टी-स्पुफिङ बायोमेट्रिक डेटासेट स्कोप

डेटासेट क्युरेसन: यो परियोजनाले उच्च-गुणस्तरको एन्टी-स्पूफिङ भिडियो डेटासेटहरू प्रदान गर्ने कुरामा केन्द्रित थियो जसमा समावेश थिए वास्तविक र पुन: प्ले आक्रमण भिडियोहरूमुख्य पक्षहरू समावेश:

  • 12,500 सहभागीहरू योगदान गर्दै दुईवटा भिडियोहरू (१ वास्तविक, १ नक्कली)।
  • रेकर्डिङ उपकरणहरूमा विविधता मोडेल अनुकूलन क्षमता बढाउन।
  • सन्तुलित जातीय प्रतिनिधित्व डेटासेट समावेशीता सुनिश्चित गर्न।

मेटाडेटा सङ्कलन: प्रत्येक भिडियोको साथमा थियो १२ मेटाडेटा विशेषताहरू डेटासेट उपयोगिता बढाउन।

भिडियो डेटा सङ्कलन चुनौतीहरू

समान प्रतिनिधित्व सुनिश्चित गर्दै

उच्च-गुणस्तरका भिडियोहरू सोर्स गर्दै जातीय रूपमा सन्तुलित डेटा वितरण कायम राख्ने।

गुणस्तर नियन्त्रण

डेटासेटको अखण्डता कायम राख्न प्रत्येक सहभागीले एउटा वास्तविक र एउटा रिप्ले आक्रमण भिडियो योगदान गर्ने कुरा सुनिश्चित गर्ने।

प्राविधिक एकरूपता

FPS (≥ २६), रिजोल्युसन (≥ ७२०p), र टाइमस्ट्याम्प शुद्धता (+/- ०.५ms) को लागि कडा दिशानिर्देशहरूको पालना गर्दै।

हामीले यसलाई कसरी समाधान गर्यौं

परियोजनाको आवश्यकताहरू पूरा गर्न श्यापले संरचित र उच्च-गुणस्तरको डेटासेट प्रदान गर्‍यो। समाधानमा समावेश थियो:

डेटासेट क्युरेसन र गुणस्तर नियन्त्रण

  • 25,000 भिडियोहरू सबैतिर सङ्कलन गरिएको 4 चरणहरू अवरोधहरूबाट बच्न, स्थिर र संरचित डेटा प्रवाह सुनिश्चित गर्न।
  • कडा प्रमाणीकरण प्रक्रिया अनुपालन सुनिश्चित गर्न FPS, रिजोल्युसन, र मेटाडेटा शुद्धता। अन्तिम स्वीकृति हुनुभन्दा पहिले प्रत्येक भिडियोको धेरै गुणस्तर जाँच गरियो।
  • व्यापक मेटाडेटा ट्यागिङ संग १२ विशेषताहरू:
  • फाइल आईडी/नाम
  • आक्रमणको प्रकार (वास्तविक/रिप्ले)
  • व्यक्ति आईडी
  • भिडियो संकल्प
  • भिडियो अवधि
  • विषयको जातीयता
  • विषयको लिङ्ग
  • भिडियो मौलिक होस् वा नक्कली होस्
  • यन्त्रको नाम/मोडेल
  • बोल्ने व्यक्ति वा नबोल्ने व्यक्ति
  • टाइमस्ट्याम्प सुरु हुने समय
  • टाइमस्ट्याम्प समाप्ति समय
  • सन्तुलित जातीय समूह वितरण: सन्तुलित जातीय प्रतिनिधित्व कायम राख्न डेटासेट सावधानीपूर्वक क्युरेट गरिएको थियो। वितरणमा हिस्पैनिक (३३%), दक्षिण एसियाली (२१%), कोकेशियन (२०%), अफ्रिकी (१५%), र पूर्वी एसियाली र मध्य पूर्वी जनसंख्या (प्रत्येकमा ६% सम्म) समावेश छन्।
  • कुनै दोहोरिएका प्रविष्टिहरू छैनन् डेटासेटको विशिष्टता कायम राख्न र एआई तालिममा पूर्वाग्रहहरू रोक्न।
  • जातीय विविधतापूर्ण सहभागी छनोट वास्तविक-विश्व प्रयोगकर्ता भिन्नताहरू प्रतिबिम्बित गर्ने डेटासेट सिर्जना गर्न, एआई मोडेल अनुकूलन क्षमता र निष्पक्षतामा सुधार गर्न।
  • रेकर्डिङ उपकरणको भिन्नता विभिन्न वातावरणीय सेटिङहरूमा मोडेलको बलियोपन बढाउन धेरै स्मार्टफोन मोडेलहरू, क्यामेराहरू, र प्रकाश अवस्थाहरू समावेश गरिएको थियो।

परिणाम

श्यापद्वारा प्रदान गरिएको उच्च-गुणस्तरको, विविध एन्टी-स्पूफिङ भिडियो डेटासेटले क्लाइन्टलाई विभिन्न बायोमेट्रिक प्रमाणीकरण परिदृश्यहरूमा वास्तविक र स्पूफ गरिएका भिडियोहरू बीच सही रूपमा भिन्नता छुट्याउन एआई मोडेलहरूलाई तालिम दिन सक्षम बनायो। डेटासेटले निम्नमा योगदान पुर्‍यायो:

सुधारिएको ठगी पत्ता लगाउने

धोखाधडी बायोमेट्रिक आक्रमणहरू पत्ता लगाउन एआई कार्यसम्पादनमा सुधार।

विविध प्रशिक्षण डाटा

विभिन्न जाति, उपकरणहरू र वातावरणीय अवस्थाहरूमा पुन: प्ले आक्रमणहरू पहिचान गर्ने मोडेलको क्षमतालाई बलियो बनायो।

Scalability

डेटासेटले भविष्यमा एन्टी-स्पूफिङ मोडेलको वृद्धि र विस्तारको लागि आधारको रूपमा काम गर्दछ।

हाम्रो एआई-संचालित एन्टी-स्पूफिङ मोडेलहरूलाई बढाउनमा शेपको डेटासेटले महत्वपूर्ण भूमिका खेलेको छ। विविधता, गुणस्तर, र संरचित मेटाडेटाले बायोमेट्रिक प्रमाणीकरण प्रणालीहरूमा ठगी पत्ता लगाउने सुधारको लागि बलियो जग प्रदान गर्‍यो।

सुनौलो-५-तारे