स्वाहिली डाटासेट
हिफाधिदाता या किस्वाहिली
एआई र स्पीच मोडेलहरूको लागि उच्च-गुणस्तरको स्वाहिली कल-सेन्टर र पोडकास्ट डेटासेट
परिचय
शीर्षक
स्वाहिली भाषा डाटासेट
डाटासेट प्रकार
कल सेन्टर
विवरण
अलिखित, "एजेन्ट" र "ग्राहक" बीच सिंथेटिक टेलिफोनिक कुराकानी, लगभग। अडियो अवधि (दायरा) 5-15 मिनेट।
प्रकरण प्रयोग गर्नुहोस्
ASR, भर्चुअल सहायक, च्याटबोट, संवादात्मक एआई, स्पीच एनालिटिक्स, TTS, भाषा मोडेलिङ
डेटा सेट विवरणहरू
कुल घण्टा
230
नमूना दर
8 kHz
अडियो च्यानल
दोहोरो
रेकर्डिङ प्लेटफर्म
डेस्कटप
अडियो स्वरूप
.wav
ट्रान्सक्रिप्शन ढाँचा
.json
WER (%)
5
डाटा सेट जनसांख्यिकी
देश
स्वाहिली
भाषा
स्वाहिली
लिंग
महिला ११८, पुरुष ११४, अज्ञात ०
स्पिकरहरूको संख्या
1,444
उमेर
18-50
परिचय
शीर्षक
स्वाहिली भाषा डाटासेट
डाटासेट प्रकार
पोडकास्ट
विवरण
लाइसेन्स योग्य सार्वजनिक डोमेन अडियो/भिडियो फाइलहरू जस्तै अन्तर्वार्ता, पोडकास्ट आदि - 1 देखि 5 व्यक्तिहरू। लगभग। अडियो अवधि (दायरा) 15-60 मिनेट।
प्रकरण प्रयोग गर्नुहोस्
ASR, भर्चुअल सहायक, च्याटबोट, संवादात्मक एआई, स्पीच एनालिटिक्स, TTS, भाषा मोडेलिङ
डेटा सेट विवरणहरू
कुल घण्टा
265
नमूना दर
16 kHz
अडियो च्यानल
मोनो
रेकर्डिङ प्लेटफर्म
वेब सोर्सिङ
अडियो स्वरूप
.wav
ट्रान्सक्रिप्शन ढाँचा
.json
WER (%)
5
डाटा सेट जनसांख्यिकी
देश
स्वाहिली
भाषा
स्वाहिली
लिंग
महिला ११८, पुरुष ११४, अज्ञात ०
स्पिकरहरूको संख्या
636
उमेर
18-50
विशेष ग्राहकहरु
विश्वको अग्रणी एआई उत्पादनहरु को निर्माण टीमहरु लाई सशक्त बनाउन।

तपाईले खोज्नु भएको कुरा फेला पार्न सक्नुहुन्न?
नयाँ अफ-द-शेल्फ डेटासेटहरू सबै डेटा प्रकारहरूमा सङ्कलन भइरहेका छन्
तपाईंको अडियो/स्पीच प्रशिक्षण डेटा सङ्कलन चिन्ताहरू छोड्न हामीलाई अहिले सम्पर्क गर्नुहोस्