आर्टिफिसियल इन्टेलिजेन्स र बिग डाटामा स्थानीय समस्याहरूलाई प्राथमिकता दिँदै र विश्वलाई धेरै गहिरो तरिकामा रूपान्तरण गर्दा विश्वव्यापी समस्याहरूको समाधान खोज्ने क्षमता छ। AI ले सबैका लागि समाधान ल्याउँछ - र सबै सेटिङहरूमा, घरदेखि कार्यस्थलसम्म। एआई कम्प्युटर, संग मिसिन प्रशिक्षण प्रशिक्षण, एक स्वचालित तर व्यक्तिगत रूपमा बौद्धिक व्यवहार र कुराकानी अनुकरण गर्न सक्छ।
यद्यपि, एआई समावेशीकरण समस्याको सामना गर्दछ र प्राय: पक्षपाती हुन्छ। सौभाग्य देखि, ध्यान केन्द्रित कृत्रिम बुद्धिमत्ता नैतिकता विविध प्रशिक्षण डेटा मार्फत बेहोश पूर्वाग्रह हटाएर विविधीकरण र समावेशीकरणको सन्दर्भमा नयाँ सम्भावनाहरूको सुरुवात गर्न सक्छ।
एआई प्रशिक्षण डेटामा विविधताको महत्त्व
एआई प्रशिक्षण को वर्तमान स्थिति डाटा
डाटामा असमानता वा विविधताको कमीले अनुचित, अनैतिक र गैर-समावेशी एआई समाधानहरू निम्त्याउँछ जसले भेदभावलाई गहिरो बनाउन सक्छ। तर कसरी र किन डाटामा विविधता एआई समाधानसँग सम्बन्धित छ?
सबै वर्गहरूको असमान प्रतिनिधित्वले अनुहारहरूको गलत पहिचान निम्त्याउँछ - बिन्दुमा एउटा महत्त्वपूर्ण मामला Google फोटो हो जसले कालो जोडीलाई 'गोरिल्ला' भनी वर्गीकृत गरेको छ। र मेटाले कालो पुरुषहरूको भिडियो हेर्दै प्रयोगकर्तालाई 'प्राइमेटहरूको भिडियोहरू हेर्न जारी राख्न' चाहेको भनेर संकेत गर्दछ।
उदाहरणका लागि, जातीय वा जातीय अल्पसंख्यकहरूको गलत वा अनुचित वर्गीकरण, विशेष गरी च्याटबटहरूमा, एआई प्रशिक्षण प्रणालीहरूमा पूर्वाग्रहको परिणाम हुन सक्छ। 2019 को रिपोर्ट अनुसार भेदभाव प्रणाली - लिङ्ग, जाति, एआई मा शक्ति, AI का 80% भन्दा बढी शिक्षकहरू पुरुष हुन्; FB मा महिला AI अनुसन्धानकर्ताहरू गुगलमा 15% र 10% मात्र छन्।
एआई प्रदर्शनमा विविध प्रशिक्षण डेटाको प्रभाव
डाटा पूर्वाग्रह प्रायः संयोगवश डाटा प्रणालीहरूमा प्रस्तुत गरिन्छ - निश्चित दौड वा समूहहरूलाई कम नमूना गरेर। जब अनुहार पहिचान प्रणालीहरू विभिन्न अनुहारहरूमा प्रशिक्षित हुन्छन्, यसले मोडेललाई अनुहारका अंगहरूको स्थिति र रंग भिन्नताहरू जस्ता विशिष्ट सुविधाहरू पहिचान गर्न मद्दत गर्दछ।
लेबलहरूको असन्तुलित फ्रिक्वेन्सी भएको अर्को परिणाम यो हो कि प्रणालीले अल्पसंख्यकलाई विसंगतिको रूपमा मान्न सक्छ जब छोटो समयमा आउटपुट उत्पादन गर्न दबाब दिइन्छ।
एआई प्रशिक्षण डाटामा विविधता हासिल गर्दै
अर्कोतर्फ, विविध डेटासेट उत्पन्न गर्नु पनि एउटा चुनौती हो। निश्चित वर्गहरूमा तथ्याङ्कको पूर्ण अभावले कम प्रतिनिधित्व हुन सक्छ। AI विकासकर्ता टोलीहरूलाई सीप, जाति, जाति, लिङ्ग, अनुशासन र थप कुराहरूमा थप विविधता बनाएर यसलाई कम गर्न सकिन्छ। यसबाहेक, AI मा डेटा विविधता समस्याहरूलाई सम्बोधन गर्ने आदर्श तरिका भनेको के भयो समाधान गर्ने प्रयास गर्नुको सट्टा गो शब्दबाट यसको सामना गर्नु हो - डाटा सङ्कलन र क्युरेसन चरणमा विविधता भित्र्याउने।
AI को वरिपरिको प्रचार जस्तोसुकै भए तापनि, यो अझै पनि मानिसहरूले सङ्कलन, चयन र प्रशिक्षित डेटामा निर्भर गर्दछ। मानिसहरूमा जन्मजात पूर्वाग्रह तिनीहरूद्वारा सङ्कलन गरिएको डेटामा प्रतिबिम्बित हुनेछ, र यो बेहोश पूर्वाग्रह ML मोडेलहरूमा पनि रिसाउँछ।
विभिन्न प्रशिक्षण डेटा सङ्कलन र क्युरेट गर्ने चरणहरू
डाटा विविधता द्वारा हासिल गर्न सकिन्छ:
- विचारपूर्वक कम-प्रतिनिधित्व वर्गहरूबाट थप डेटा थप्नुहोस् र विभिन्न डेटा बिन्दुहरूमा तपाईंको मोडेलहरू उजागर गर्नुहोस्।
- विभिन्न डाटा स्रोतहरूबाट डाटा सङ्कलन गरेर।
- मूल डेटा बिन्दुहरू भन्दा फरक फरक नयाँ डेटा बिन्दुहरू बढाउन/समावेश गर्न डेटा वृद्धि वा कृत्रिम रूपमा डेटासेटहरू हेरफेर गरेर।
- एआई विकास प्रक्रियाको लागि आवेदकहरूलाई भर्ती गर्दा, आवेदनबाट सबै काम-अप्रासंगिक जानकारी हटाउनुहोस्।
- मोडलहरूको विकास र मूल्याङ्कनको दस्तावेजीकरणमा सुधार गरी पारदर्शिता र जवाफदेहिता सुधार गर्ने।
- विविधता निर्माण गर्न नियमहरू प्रस्तुत गर्दै र AI मा समावेशीता तल्लो तहबाट प्रणालीहरू। विभिन्न सरकारहरूले विविधता सुनिश्चित गर्न र अनुचित परिणामहरू प्रदान गर्न सक्ने AI पूर्वाग्रहलाई कम गर्न दिशानिर्देशहरू विकास गरेका छन्।
[यो पनि पढ्नुहोस्: AI प्रशिक्षण डाटा सङ्कलन प्रक्रिया बारे थप जान्नुहोस् ]
निष्कर्ष
हाल, केही ठूला प्राविधिक कम्पनीहरू र सिकाइ केन्द्रहरू मात्र AI समाधानहरू विकास गर्नमा संलग्न छन्। यी अभिजात वर्गहरू बहिष्कार, भेदभाव र पूर्वाग्रहले भरिएका छन्। यद्यपि, यी ती ठाउँहरू हुन् जहाँ एआई विकास भइरहेको छ, र यी उन्नत एआई प्रणालीहरू पछाडिको तर्क समान पूर्वाग्रह, भेदभाव र कम प्रतिनिधित्व भएका समूहहरूले उठाएको बहिष्कारले भरिएको छ।
विविधता र गैर-भेदभावको चर्चा गर्दा, यसले मानिसहरूलाई फाइदा र हानि गर्नेहरूलाई प्रश्न गर्न महत्त्वपूर्ण छ। हामीले यो पनि हेर्नुपर्छ कि यसले कसलाई हानि पुर्याउँछ - एक 'सामान्य' व्यक्तिको विचारलाई जबरजस्ती गरेर, एआईले सम्भावित रूपमा 'अरूलाई' जोखिममा पार्न सक्छ।
शक्ति सम्बन्ध, इक्विटी र न्यायलाई स्वीकार नगरी एआई डाटामा विविधताको बारेमा छलफल गर्दा ठूलो तस्वीर देखाउँदैन। AI प्रशिक्षण डेटामा विविधताको दायरालाई पूर्णतया बुझ्न र कसरी मानव र एआई मिलेर यस संकटलाई कम गर्न सक्छन्, Shaip मा इन्जिनियरहरु सम्म पुग्नुहोस्। हामीसँग विविध AI इन्जिनियरहरू छन् जसले तपाईंको AI समाधानहरूको लागि गतिशील र विविध डेटा प्रदान गर्न सक्छन्।