Hinglish डाटासेट
हिंग्लिश सदस्य
एआई र स्पीच मोडेलहरूको लागि उच्च-गुणस्तरको हिंग्लिश कल-सेन्टर र पोडकास्ट डेटासेट
परिचय
शीर्षक
हिंग्लिस भाषा डाटासेट
डाटासेट प्रकार
कल सेन्टर
विवरण
अलिखित, "एजेन्ट" र "ग्राहक" बीच सिंथेटिक टेलिफोनिक कुराकानी, लगभग। अडियो अवधि (दायरा) 5-15 मिनेट।
प्रकरण प्रयोग गर्नुहोस्
ASR, भर्चुअल सहायक, च्याटबोट, संवादात्मक एआई, स्पीच एनालिटिक्स, TTS, भाषा मोडेलिङ
डेटा सेट विवरणहरू
कुल घण्टा
208
नमूना दर
8 kHz
अडियो च्यानल
दोहोरो
रेकर्डिङ प्लेटफर्म
डेस्कटप
अडियो स्वरूप
.wav
ट्रान्सक्रिप्शन ढाँचा
.json
WER (%)
5
डाटा सेट जनसांख्यिकी
देश
हिंग्लिस
भाषा
हिंग्लिस
लिंग
महिला १०८६, पुरुष २१०, अज्ञात ४
स्पिकरहरूको संख्या
2,084
उमेर
18-50
परिचय
शीर्षक
हिंग्लिस भाषा डाटासेट
डाटासेट प्रकार
पोडकास्ट
विवरण
लाइसेन्स योग्य सार्वजनिक डोमेन अडियो/भिडियो फाइलहरू जस्तै अन्तर्वार्ता, पोडकास्ट आदि - 1 देखि 5 व्यक्तिहरू। लगभग। अडियो अवधि (दायरा) 15-60 मिनेट।
प्रकरण प्रयोग गर्नुहोस्
ASR, भर्चुअल सहायक, च्याटबोट, संवादात्मक एआई, स्पीच एनालिटिक्स, TTS, भाषा मोडेलिङ
डेटा सेट विवरणहरू
कुल घण्टा
216
नमूना दर
16 kHz
अडियो च्यानल
मोनो
रेकर्डिङ प्लेटफर्म
वेब सोर्सिङ
अडियो स्वरूप
.wav
ट्रान्सक्रिप्शन ढाँचा
.json
WER (%)
5
डाटा सेट जनसांख्यिकी
देश
हिंग्लिस
भाषा
हिंग्लिस
लिंग
महिला ११८, पुरुष ११४, अज्ञात ०
स्पिकरहरूको संख्या
455
उमेर
18-50
विशेष ग्राहकहरु
विश्वको अग्रणी एआई उत्पादनहरु को निर्माण टीमहरु लाई सशक्त बनाउन।

तपाईले खोज्नु भएको कुरा फेला पार्न सक्नुहुन्न?
नयाँ अफ-द-शेल्फ डेटासेटहरू सबै डेटा प्रकारहरूमा सङ्कलन भइरहेका छन्
तपाईंको अडियो/स्पीच प्रशिक्षण डेटा सङ्कलन चिन्ताहरू छोड्न हामीलाई अहिले सम्पर्क गर्नुहोस्