कार भित्र आवाज डाटा संग्रह

केस स्टडी: इन-कार आवाज-सक्रिय प्रणालीहरूको लागि मुख्य वाक्यांश संग्रह
कुञ्जी वाक्यांश संग्रह

अटो उद्योगमा इन-कार भ्वाइस-सक्रिय प्रणालीहरूको लागि बढ्दो माग छ, हामी कसरी हाम्रो गतिशीलता वाहनहरूसँग संलग्न हुन्छौं भनेर पुन: परिभाषित गर्दै।

अटोमोटिभ उद्योगले फोर्ड, टेस्ला र BMW जस्ता ठूला खेलाडीहरूले आफ्ना सवारी साधनहरूमा उन्नत आवाज पहिचानलाई एकीकृत गरेर आवाज-सक्रिय प्रणालीहरू द्रुत रूपमा अपनाएको छ। 2022 सम्म, यो अनुमान गरिएको थियो कि 50% भन्दा बढी नयाँ कारहरूमा आवाज पहिचान क्षमताहरू छन्। यी एकीकरणहरूले ड्राइभरहरूलाई नेभिगेसन, मनोरञ्जन, र सञ्चार कार्यहरू बिना कुनै अवरोधहरू सञ्चालन गर्न अनुमति दिँदै सुरक्षा वृद्धि गर्ने लक्ष्य राख्छन्।

अटोमा आवाज पहिचानको बजार मूल्य 1 सम्ममा $2023 बिलियन नाघेको प्रक्षेपण गरिएको थियो, जसले ह्यान्ड्स-फ्री, इन्टेलिजेन्ट इन-कार अन्तरक्रियाहरूको बढ्दो मागलाई सङ्केत गर्छ।

मोटर

अनुसन्धानले सुझाव दिन्छ कि 2022 सम्म, 73% चालकहरूले इन-कार भ्वाइस सहायक प्रयोग गर्नेछन्।

२०२१ मा अटोमोटिभ भ्वाइस रिकग्निसन सिस्टम मार्केटको मूल्य USD २.०१ बिलियन थियो, र २०२७ सम्ममा USD ३.५१ बिलियन पुग्ने अपेक्षा गरिएको छ, लगभग ८.०७% को CAGR दर्ता गर्दै।

वास्तविक विश्व समाधान

डेटा जसले आवाज-सक्रिय प्रणालीहरूलाई शक्ति दिन्छ

कारहरूमा आवाज-सक्रिय प्रणालीहरूले सुरक्षा र सुविधा बढाउँछ। तिनीहरूले ड्राइभरहरूलाई नेभिगेसन पहुँच गर्न, कलहरू गर्न, पाठहरू पठाउन, र सडकबाट हातहरू वा आँखाबाट टाढा नलिइकन संगीत नियन्त्रण गर्न अनुमति दिन्छ। मौखिक आदेशहरूमा प्रतिक्रिया दिएर, यी प्रणालीहरूले व्याकुलता कम गर्दछ, बहुकार्यलाई बढावा दिन्छ, र ड्राइभिङमा निरन्तर फोकस सुनिश्चित गर्दछ। 

ग्राहक कुराकानीत्मक बुद्धिमत्तामा एक विश्वव्यापी नेता हो जसले भ्वाइस एआई समाधानहरू प्रदान गर्दछ जसले व्यवसायहरूलाई आफ्ना ग्राहकहरूलाई अविश्वसनीय कुराकानी अनुभवहरू प्रदान गर्दछ। तिनीहरू ब्रान्डेड कुञ्जी वाक्यांशहरू र शाइपको अडियो डेटा सङ्कलनमा विशेषज्ञता आवश्यक पर्ने भ्वाइस-सक्रिय प्रणालीहरूलाई तालिम दिन अग्रणी मोटर वाहन कम्पनीहरूसँग काम गरिरहेका थिए।

वास्तविक संसार समाधान
चुनौतीहरू

चुनौतीहरू

  • क्राउड सोर्सिङ: विश्वव्यापी रूपमा प्रति भाषा 2800+ नेटिभ स्पिकरहरू भर्ती गर्नुहोस्।
  • तथ्यांक संकलन: 200 भाषाहरूमा निर्धारित समय सीमा भित्र 12k+ प्रम्प्टहरू सुरक्षित गर्नुहोस्।
  • सन्दर्भ र आशय पहिचान: प्रयोगकर्ताका अनुरोधहरू सही रूपमा बुझ्नको लागि, एउटै कुञ्जी वाक्यांशका लागि विभिन्न भिन्नताहरूमा प्रणालीहरूलाई तालिम दिन आवश्यक छ।
  • पृष्ठभूमि शोर ह्यान्डलिंग: ML मोडेल सटीकताको लागि वास्तविक-विश्व पृष्ठभूमि शोर ठेगाना।
  • पूर्वाग्रह कम गर्दै: समावेशीता सुनिश्चित गर्न विविध जनसांख्यिकीबाट आवाज नमूनाहरू प्राप्त गर्नुहोस्.
  • अडियो विनिर्देशहरू: 16khz 16bits PCM, मोनो, एकल-च्यानल, WAV; कुनै प्रशोधन छैन।
  • रेकर्डिङ वातावरण: रेकर्डिङहरूमा पृष्ठभूमि आवाज वा अवरोध बिना सफा अडियो हुनुपर्छ। सामान्य बोली प्रयोग गरेर रेकर्ड गरिनु पर्ने मुख्य वाक्यांशहरू।
  • गुणस्तर जाँच:  सबै भाषण रेकर्डिङहरू गुणस्तर मूल्याङ्कन र प्रमाणीकरणबाट गुज्रनेछन्, केवल मान्य भाषण रेकर्डिङहरू डेलिभर गरिनेछ। यदि Shaip सहमत गुणस्तर मापदण्डहरू पूरा गर्दैन भने, Shaip ले कुनै अतिरिक्त लागत बिना डेटा पुन: वितरण गर्नेछ

समाधान

वार्तालापात्मक एआई स्पेस मा आफ्नो विशेषज्ञता संग Shaip ले ग्राहक लाई सक्षम बनायो:

  • तथ्यांक संकलन: तोकिएको समयसीमामा २८०० स्पिकरहरूबाट १२ विश्वव्यापी भाषाहरूमा सङ्कलन गरिएका २०८ हजार प्रमुख वाक्यांश/ब्रान्ड प्रम्प्टहरू
  • विभिन्न उच्चारण र बोलीहरू: विश्वभरिबाट भर्ती विशेषज्ञहरू, इच्छित उच्चारण र बोलीहरूमा निपुण।
  • सन्दर्भ र आशय पहिचान: प्रत्येक वक्तालाई 20 भिन्न भिन्नताहरूमा मुख्य वाक्यांशहरू रेकर्ड गर्ने जिम्मा दिइएको थियो, ML मोडेलहरूलाई सन्दर्भ र अभिप्रायको सन्दर्भमा प्रयोगकर्ताका अनुरोधहरूलाई सही रूपमा बुझ्न सक्षम पार्दै।
  • पृष्ठभूमि शोर ह्यान्डलिंग: पुरानो अडियो गुणस्तर सुनिश्चित गर्न, हामीले निश्चित गर्यौं कि मुख्य वाक्यांशहरू 40dB भन्दा कम शोरको स्तरको साथ शान्त वातावरणमा, टिभी, रेडियो, संगीत, वाणी, वा सडक ध्वनिहरू जस्ता पृष्ठभूमिमा अवरोधहरू नगरिएका छन्।
  • पूर्वाग्रह कम गर्दै: पूर्वाग्रहलाई न्यूनीकरण गर्न, हामीले विभिन्न क्षेत्रका व्यक्तिहरूलाई संलग्न गरायौं र 50% पुरुष र 50% महिलाहरूको साथ सन्तुलित जनसांख्यिकीय प्रतिनिधित्व कायम राख्यौं, 18 देखि 60 वर्ष सम्मका उमेर समूहहरू।
  • रेकर्डिङ दिशानिर्देशहरू: मुख्य वाक्यांशहरू एक सुसंगत, सामान्य बोली ढाँचामा कैद गरिएका थिए, कुनै पनि भिन्नताहरू बिना छिटो वा ढिलो गति। भाषणको कुनै पनि भाग अनजानमा काटिएको छैन भनी ग्यारेन्टी गर्न सुरु र अन्त्यमा २-सेकेन्ड मौन।
  • रेकर्डिङ ढाँचा: अडियो 16kHz मा रेकर्ड गरिएको थियो, मोनोमा 16-बिट PCM, एकल च्यानल प्रयोग गरी, र WAV फाइल ढाँचामा बचत गरियो। अडियो अप्रशोधित रहन्छ, यसको मतलब त्यहाँ कम्प्रेसन, रिभरब, वा EQ को कुनै अनुप्रयोग थिएन।
  • गुणस्तर: प्रत्येक भाषण रेकर्डिङ कठोर गुणस्तर जाँच र प्रमाणीकरणको अधीनमा थियो। यो मूल्याङ्कन पास गर्ने रेकर्डिङहरू मात्र डेलिभर गरियो। कुनै पनि फाइलहरू जुन सहमतिमा गुणस्तर मापदण्डहरू भन्दा कम परेका थिए पुन: रेकर्ड गरियो र कुनै अतिरिक्त शुल्क बिना प्रदान गरियो।
समाधान
परिणाम

परिणाम

उच्च-गुणस्तरको ब्रान्ड कुञ्जी वाक्यांश अडियो डेटा वा भ्वाइस प्रम्प्टहरूले अटोमोटिभ कम्पनीहरू र तिनीहरूका ग्राहकहरूलाई सक्षम पार्नेछ:

  1. ब्रान्डिङ र पहिचान: विशिष्ट, ब्रान्ड वाक्यांशको साथ भ्वाइस प्रम्प्टहरूले कम्पनीहरूलाई प्रयोगकर्ता र ब्रान्ड बीच प्रत्यक्ष र यादगार जडान सिर्जना गर्न मद्दत गर्दछ जसले ब्रान्ड सम्झनालाई बढाउँछ।
  2. प्रयोगमा सजिलो: भ्वाइस कमाण्डहरूले चालकहरूलाई सवारीसाधनको पाङ्ग्राबाट हात नहटाएर वा सडकबाट आँखा नहटाएर सवारी साधनसँग अन्तरक्रिया गर्न सजिलो बनाउँछ जसले गर्दा सडक सुरक्षा बढ्छ।
  3. कार्यक्षमता: आवाज आदेशहरूले कार सुविधाहरू पहुँच गर्न र नियन्त्रण गर्न थप सहज बनाउँछ। चाहे यसको नेभिगेसन होस्, मिडिया प्लेब्याक होस् वा जलवायु नियन्त्रण होस्।
  4. अन्य प्रणालीहरु संग एकीकरण: धेरै आवाज-सक्रिय प्रणालीहरू स्मार्टफोनहरू, स्मार्ट गृह उपकरणहरू, र अन्य IoT उपकरणहरूसँग एकीकृत छन्। उदाहरणका लागि, प्रयोगकर्ताले आफ्नो कारलाई घरमा पुग्दा घरमा बत्तीहरू अन गर्न सोध्न सक्छन्।
  5. प्रतिस्पर्धी लाभ: उन्नत भ्वाईस-सक्रिय प्रणालीहरू प्रस्ताव गर्नु एक बिक्री बिन्दु र एक भिन्नता हुन सक्छ। नयाँ कार खरिद गर्दा खरिदकर्ताहरूले नवीनतम प्रविधि खोज्छन्।
  6. भविष्य प्रमाणीकरण: प्रविधिको विकास हुँदै जाँदा र IoT दैनिक जीवनमा थप एकीकृत हुँदै गइरहेको छ, बलियो आवाज-सक्रिय प्रणालीले अटोमोटिभ कम्पनीहरूलाई भविष्यको प्राविधिकमा थप अनुकूलनीय बनाउँछ।
  7. राजस्व अवसरहरू: अतिरिक्त मुद्रीकरण अवसरहरू जस्तै, भ्वाइस प्रणालीहरूले सिफारिसहरू वा एकीकृत ई-वाणिज्य अनुभवहरू (जस्तै खाना अर्डर गर्ने वा नजिकका सेवाहरू फेला पार्ने) प्रस्ताव गर्दछ जसले सम्बद्ध राजस्व प्रदान गर्न सक्छ।
सुनौलो-५-तारे

जब हामीले अटोमोटिभ क्षेत्रका लागि भ्वाइस प्रम्प्टहरू सोर्स गर्न थाल्यौं, चुनौतीहरू धेरै थिए। हाम्रो ग्राहकको विश्वव्यापी ग्राहकको प्रतिनिधित्व गर्न बोली, उच्चारण, र टोनमा विविधता कैद गर्नु महत्त्वपूर्ण थियो। शाइप एक विक्रेताको रूपमा मात्र होइन, तर एक साँचो साझेदारको रूपमा उभिए। विभिन्न क्षेत्रबाट विभिन्न आवाजहरूको दायरा सुरक्षित गर्ने तिनीहरूको प्रतिबद्धता सराहनीय थियो। तिनीहरू केवल आवाजहरू जम्मा गर्न भन्दा पर गए। तिनीहरूले हाम्रो परियोजना आवश्यकताहरूको सूक्ष्मताहरू बुझे, उच्च-निशान रेकर्डिङहरू ग्यारेन्टी गर्दै। अडियो सङ्कलन मापदण्डहरूमा तिनीहरूको निर्दोष पालनाले तिनीहरूको व्यावसायिकता र परियोजनाप्रति समर्पण प्रदर्शन गर्‍यो।

तपाईंको कुराकानीत्मक एआई अनुप्रयोग विकासलाई १००% ले तीव्र पार्नुहोस्।