एआई एल्गोरिथ्म तपाईले फिड गर्ने डेटा जत्तिकै राम्रो छ।
यो न त बोल्ड हो न अपरम्परागत कथन। एआई केही दशक पहिले धेरै टाढाको जस्तो देखिन सक्छ, तर कृत्रिम बुद्धिमत्ता र मेशिन लर्निङले त्यसबेलादेखि धेरै लामो यात्रा गरेको छ।
कम्प्युटर दृष्टि कम्प्युटरहरूलाई लेबल र छविहरू बुझ्न र व्याख्या गर्न मद्दत गर्दछ। जब तपाइँ तपाइँको कम्प्युटरलाई सही प्रकारको छवि डेटासेटहरू प्रयोग गरेर तालिम दिनुहुन्छ, यसले विभिन्न अनुहारका विशेषताहरू पत्ता लगाउन, बुझ्न र पहिचान गर्न, रोगहरू पत्ता लगाउन, स्वायत्त सवारी साधनहरू चलाउन, र बहु-आयामी अंग स्क्यानिङ प्रयोग गरेर जीवन बचाउन सक्ने क्षमता प्राप्त गर्न सक्छ।
कम्प्युटर भिजन बजार पुग्ने अनुमान गरिएको छ $ 144.46 बिलियन २०२१ र २०२८ को बीचमा ४५.६४% को CAGR मा बढ्दै, २०२० मा साधारण $७.०४ बिलियनबाट २०२८ सम्म।
यो छवि डेटासेट तपाईं आफ्नो मेसिन लर्निङ र कम्प्युटर भिजन टास्कहरू खुवाउँदै हुनुहुन्छ र तालिम दिनुहुन्छ तपाईंको AI प्रोजेक्टको सफलताको लागि महत्त्वपूर्ण छ। एक गुणस्तर डेटासेट प्राप्त गर्न धेरै गाह्रो छ। तपाइँको परियोजना को जटिलता मा निर्भर गर्दछ, यो कम्प्यूटर दृष्टि उद्देश्यहरु को लागी भरपर्दो र सान्दर्भिक डाटासेट प्राप्त गर्न केहि दिन देखि केहि हप्ता सम्म लाग्न सक्छ।
यहाँ, हामीले तपाईलाई तुरुन्तै प्रयोग गर्न सक्ने खुला स्रोत छवि डेटासेटहरूको दायरा (तपाईंको सहजताको लागि वर्गीकृत) प्रदान गर्छौं।
तपाईंको कम्प्युटर भिजन मोडेललाई तालिम दिन छवि डाटासेटहरूको विस्तृत सूची
सामान्य:
IMAGEnet
ImageNet एक व्यापक रूपमा प्रयोग गरिएको डेटासेट हो, र यो 1.2 कोटिहरूमा वर्गीकृत 1000 मिलियन छविहरूको साथ आउँछ। यो डाटासेट वर्ल्डनेट पदानुक्रम अनुसार संगठित छ र तीन भागहरूमा वर्गीकृत गरिएको छ - प्रशिक्षण डेटा, छवि लेबलहरू, र प्रमाणीकरण डाटा।
काइनेटिक्स 700
Kinetics 700 650,000 बिभिन्न मानव कार्य वर्गहरूको 700 भन्दा बढी क्लिपहरू भएको एक विशाल उच्च-गुणस्तरको डेटासेट हो। प्रत्येक कक्षा कार्यमा लगभग 700 भिडियो क्लिपहरू छन्। डेटासेटका क्लिपहरूमा मानव-वस्तु र मानव-मानव अन्तरक्रियाहरू हुन्छन्, जुन भिडियोहरूमा मानवीय कार्यहरू पहिचान गर्दा धेरै उपयोगी साबित भइरहेका छन्।
CIFAR-10
CIFAR 10 60000 32 x 32 रङ छविहरू घमण्ड गर्ने सबैभन्दा ठूलो कम्प्युटर-भिजन डेटासेटहरू मध्ये एक हो जुन दस विभिन्न वर्गहरूको प्रतिनिधित्व गर्दछ। प्रत्येक कक्षामा कम्प्युटर भिजन एल्गोरिदम र मेसिन लर्निङ प्रशिक्षित गर्न प्रयोग गरिने लगभग 6000 छविहरू छन्।
अक्सफोर्ड-IIIT पालतू छविहरू डाटासेट
पाल्तु जनावर छवि डेटासेट प्रति वर्ग 37 छविहरू संग 200 कोटिहरू समावेश गर्दछ। यी छविहरू स्केल, पोज, र प्रकाशमा भिन्न हुन्छन्, र नस्ल, हेड ROI, र पिक्सेल-स्तर ट्रिम्याप विभाजनका लागि एनोटेसनहरूसँगै छन्।
गुगलको खुला छविहरू
एक प्रभावशाली 9 मिलियन URL को साथ, यो सूचीमा सबैभन्दा ठूलो छवि डेटासेटहरू मध्ये एक हो, 6,000 कोटीहरूमा लेबल गरिएका लाखौं छविहरू समावेश गर्दछ।
बिरुवा छविहरू
यस संकलनले लगभग 1 प्रजातिहरूलाई समेट्ने प्रभावशाली 11 मिलियन बिरुवाका छविहरू प्रस्तुत गर्ने बहु छवि डेटासेटहरू समावेश गर्दछ।
अनुहार पहिचान:
वाइल्डमा लेबल गरिएको अनुहारहरू
लेबल गरिएको फेस्ड इन द वाइल्ड एक विशाल डाटासेट हो जसमा इन्टरनेटबाट पत्ता लगाइएको लगभग 13,230 व्यक्तिहरूको 5,750 भन्दा बढी छविहरू छन्। अनुहारहरूको यो डेटासेट अनियन्त्रित अनुहार पत्ता लगाउन अध्ययन गर्न सजिलो बनाउन डिजाइन गरिएको हो।
CASIA वेबफेस
CASIA वेब फेस राम्रोसँग डिजाइन गरिएको डाटासेट हो जसले मेसिन लर्निङ र अनुहारको अनुहार पहिचान गर्न वैज्ञानिक अनुसन्धानमा मद्दत गर्छ। लगभग 494,000 वास्तविक पहिचानहरूको 10,000 भन्दा बढी छविहरूसँग, यो अनुहार पहिचान र प्रमाणिकरण कार्यहरूको लागि आदर्श हो।
UMD फेस डाटासेट
UMD ले राम्रोसँग एनोटेटेड डेटासेटको सामना गर्दछ जसमा दुई भागहरू छन् - स्थिर छविहरू र भिडियो फ्रेमहरू। डेटासेटमा 367,800 भन्दा बढी अनुहार एनोटेसनहरू र विषयहरूको 3.7 मिलियन एनोटेटेड भिडियो फ्रेमहरू छन्।
अनुहार मास्क पत्ता लगाउने
यस डेटासेटले PASCAL VOC ढाँचामा तिनीहरूको बाउन्डिङ बक्सहरू सहित "मास्क सहित," "मास्क बिना," र "गलत तरिकाले लगाउने मास्क," तीन वर्गहरूमा वर्गीकृत 853 छविहरू समावेश गर्दछ।
FERET
FERET (फेसियल रिकग्निसन टेक्नोलोजी डाटाबेस) मानव अनुहारहरूको 14,000 एनोटेट छविहरू समावेश गर्ने एक व्यापक छवि डेटासेट हो।
हस्तलेखन पहिचान:
MNIST डाटाबेस
MNIST 0 देखि 9 सम्म हस्तलिखित अंकहरूको नमूनाहरू समावेश गर्ने डाटाबेस हो, र यसमा 60,000 र 10,000 प्रशिक्षण र परीक्षण छविहरू छन्। 1999 मा जारी गरिएको, MNIST ले डीप लर्निङमा छवि प्रशोधन प्रणालीहरू परीक्षण गर्न सजिलो बनाउँछ।
कृत्रिम वर्ण डाटासेट
आर्टिफिशियल क्यारेक्टर्स डाटासेट भनेको नामले सुझाव दिए जस्तै कृत्रिम रूपमा उत्पन्न डाटा हो जसले अंग्रेजी भाषाको संरचनालाई दस ठूला अक्षरहरूमा वर्णन गर्दछ। यो 6000 भन्दा बढी छविहरूसँग आउँछ।
वस्तु पत्ता लगाउने:
एमएस कोको
MS COCO वा Common Objects in Context एक वस्तु पत्ता लगाउने र क्याप्शनिङ डेटासेट हो।
यसमा किपोइन्ट पत्ता लगाउने, बहु-वस्तु पत्ता लगाउने, क्याप्शनिङ, र विभाजन मास्क एनोटेसनहरू सहित 328,000 भन्दा बढी छविहरू छन्। यो 80 वस्तु कोटिहरु र प्रति छवि पाँच क्याप्शन संग आउँछ।
LSUN
LSUN, ठूलो स्केल दृश्य बुझाइको लागि छोटो, 20 वस्तु र 10 दृश्य कोटिहरूमा एक मिलियन भन्दा बढी लेबल गरिएका छविहरू छन्। केहि वर्गहरूमा 300,000 छविहरू छन्, 300 छविहरू विशेष रूपमा प्रमाणीकरणको लागि र 1000 छविहरू परीक्षण डेटाको लागि।
गृह वस्तुहरू
गृह वस्तुहरू डेटासेटले घर वरपरका अनियमित वस्तुहरूको एनोटेट छविहरू समावेश गर्दछ - भान्साकोठा, बैठक कोठा, र बाथरूम। यस डेटासेटमा परीक्षणको लागि डिजाइन गरिएका केही एनोटेट भिडियोहरू र 398 अननोटेटेड फोटोहरू पनि छन्।
मोटर वाहन:
Cityscape डेटासेट
सिटीस्केप एक डाटासेट हो जसमा जानको लागि धेरै उद्धृत सडक दृश्यहरूबाट रेकर्ड गरिएका विभिन्न भिडियो अनुक्रमहरू खोज्दा। यी तस्बिरहरू लामो समय र विभिन्न मौसम र प्रकाश परिस्थितिहरूमा कैद गरिएका थिए। एनोटेसनहरू 30 वर्गका तस्बिरहरूका लागि आठ विभिन्न कोटीहरूमा विभाजित छन्।
बार्कले डीप ड्राइभ
Barkley DeepDrive विशेष गरी स्वायत्त सवारी साधन प्रशिक्षणको लागि डिजाइन गरिएको हो, र यसमा 100 हजार भन्दा बढी एनोटेटेड भिडियो दृश्यहरू छन्। यो सडक र ड्राइभिङ अवस्थाहरू द्वारा स्वायत्त सवारी साधनहरूको लागि सबैभन्दा उपयोगी प्रशिक्षण डेटा मध्ये एक हो।
म्यापिलरी
Mapillary सँग विश्वभरि 750 मिलियन भन्दा बढी सडक दृश्यहरू र ट्राफिक संकेतहरू छन्, जुन मेसिन लर्निङ र AI एल्गोरिदमहरूमा भिजुअल धारणा मोडेलहरू प्रशिक्षण दिन धेरै उपयोगी छ। यसले तपाईंलाई विभिन्न प्रकाश र मौसम अवस्था र दृष्टिकोणहरू पूरा गर्ने स्वायत्त सवारी साधनहरू विकास गर्न अनुमति दिन्छ।
मेडिकल इमेजिङ:
Covid-19 खुला अनुसन्धान डाटासेट
यस मौलिक डेटासेटमा AP/PA छातीको एक्स-रेहरूको बारेमा लगभग 6500 पिक्सेल-पोलिगोनल फोक्सोको विभाजनहरू छन्। थप रूपमा, नाम, स्थान, भर्ना विवरण, नतिजा, र थप समावेश ट्यागहरू सहित Covid-517 बिरामीको एक्स-रेहरूको 19 छविहरू उपलब्ध छन्।
100,000 छाती एक्स-रेहरूको NIH डाटाबेस
NIH डाटाबेस वैज्ञानिक र अनुसन्धान समुदायको लागि उपयोगी 100,000 छाती एक्स-रे छविहरू र सम्बन्धित डेटा समावेश गर्ने सबैभन्दा व्यापक सार्वजनिक रूपमा उपलब्ध डाटासेटहरू मध्ये एक हो। यसमा उन्नत फोक्सो अवस्था भएका बिरामीहरूको छविहरू पनि छन्।
डिजिटल रोगविज्ञान को एटलस
डिजिटल प्याथोलोजीको एटलसले विभिन्न अंगहरूको लगभग 17,000 एनोटेटेड स्लाइडहरूबाट, कुल 100 भन्दा बढी हिस्टोपाथोलोजिकल प्याच छविहरू प्रदान गर्दछ। यो डाटासेट कम्प्युटर दृष्टि र ढाँचा पहिचान सफ्टवेयर विकास गर्न उपयोगी छ।
दृश्य पहिचान:
इनडोर दृश्य पहिचान
इनडोर सीन रिकग्निसन एक उच्च वर्गीकृत डाटासेट हो जसमा लगभग 15620 वस्तुहरू र इनडोर दृश्यहरू मेसिन लर्निंग र डेटा प्रशिक्षणमा प्रयोग गर्न सकिन्छ। यो 65 भन्दा बढी कोटिहरु संग आउँछ, र प्रत्येक कोटि मा न्यूनतम 100 छविहरु छ।
xView
सार्वजनिक रूपमा उपलब्ध सबै भन्दा राम्रो डेटासेटहरू मध्ये एकको रूपमा, xView ले विभिन्न जटिल र ठूला दृश्यहरूबाट एनोटेटेड ओभरहेड इमेजरीहरू समावेश गर्दछ। लगभग 60 कक्षाहरू र एक मिलियन भन्दा बढी वस्तु उदाहरणहरू भएको, यस डेटासेटको उद्देश्य उपग्रह इमेजरी प्रयोग गरेर राम्रो विपद् राहत प्रदान गर्नु हो।
स्थानहरू
स्थानहरू, MIT द्वारा योगदान गरिएको डेटासेटमा 1.8 विभिन्न दृश्य कोटीहरूबाट 365 मिलियन भन्दा बढी छविहरू छन्। प्रमाणीकरणको लागि यी प्रत्येक कोटीहरूमा लगभग 50 छविहरू छन् र परीक्षणको लागि 900 छविहरू छन्। दृश्य पहिचान वा दृश्य पहिचान कार्यहरू स्थापना गर्न गहिरो दृश्य सुविधाहरू सिक्न सम्भव छ।
मनोरञ्जन:
IMDB WIKI डाटासेट
IMDB - Wiki अनुहारहरूको सबैभन्दा लोकप्रिय सार्वजनिक डाटाबेसहरू मध्ये एक हो जुन उमेर, लिङ्ग, र नामहरूको साथ पर्याप्त रूपमा लेबल गरिएको छ। यसमा करिब २० हजार सेलिब्रेटीहरू र विकिपिडियाका ६२ हजार अनुहार छन्।
सेलिब्रिटी अनुहारहरू
Celeb Faces सेलिब्रेटीहरूको 200,000 एनोटेट छविहरूको साथ एक ठूलो-स्तरको डाटाबेस हो। छविहरू पृष्ठभूमि शोर र पोज भिन्नताहरूसँग आउँछन्, तिनीहरूलाई कम्प्युटर दृष्टि कार्यहरूमा प्रशिक्षण परीक्षण सेटहरूको लागि मूल्यवान बनाउँदछ। यो अनुहार पहिचान, सम्पादन, अनुहार भाग स्थानीयकरण, र थप मा उच्च सटीकता प्राप्त गर्न को लागी धेरै लाभदायक छ।
अब तपाईंसँग तपाईंको कृत्रिम बुद्धिमत्ता मेसिनरीलाई इन्धन गर्न खुला स्रोत छवि डेटासेटहरूको ठूलो सूची छ। तपाईंको AI र मेसिन लर्निङ मोडेलहरूको नतिजा मुख्य रूपमा तपाईंले फिड गर्ने र तिनीहरूलाई तालिम दिने डेटासेटहरूको गुणस्तरमा निर्भर गर्दछ। यदि तपाइँ तपाइँको AI मोडेलले सही भविष्यवाणीहरू फेला पार्न चाहनुहुन्छ भने, यसलाई समग्र, ट्याग गरिएको, र पूर्णतामा लेबल गरिएको गुणस्तर डेटासेटहरू चाहिन्छ। तपाइँको कम्प्यूटर दृष्टि प्रणाली को सफलता को विस्तार गर्न को लागी, तपाइँ तपाइँको परियोजना दृष्टि संग सम्बन्धित गुणस्तर छवि डेटाबेस को उपयोग गर्न को लागी। यदि तपाइँ त्यस्ता थप डेटासेटहरू खोज्दै हुनुहुन्छ भने यहाँ क्लिक