कंप्यूटर पर जार्विस रूसी। टाइप - कंप्यूटर वॉयस कंट्रोल

अधिकांश उपयोगकर्ता जानते हैं कि सिरी सिस्टम को आईओएस गैजेट्स पर सबसे लोकप्रिय व्यक्तिगत सहायक और प्रश्नोत्तर तकनीक माना जाता है। सौभाग्य से, न केवल सिरी प्रणाली बाजार में उपलब्ध है। तो, मार्वल द्वारा बनाई गई विज्ञान कथा और कॉमिक्स के प्रशंसकों को फिल्म "आयरन मैन" से एक निजी सहायक जार्विस की पेशकश की जाती है।

यदि डिवाइस के मालिक ने फिल्म "आयरन मैन" देखी है, तो वह शायद टोनी स्टार्क के बटलर को जानता है, जिसका नाम जार्विस है। नतीजतन, उपयोगकर्ता अपने पोर्टेबल डिवाइस पर वर्चुअल सर्वेंट की मदद का सहारा ले सकेगा। इसके अलावा, जार्विस कार्यक्रम एक अनूठा विकास है जो जार्विस चरित्र की आवाज और छवि का उपयोग करता है।

JARVIS उपयोगिता निर्दिष्ट उपकरण के उपयोग और प्रबंधन के लिए सामान्य ऑडियो निर्देशों के साथ शुरू होती है। सेटअप के अंत में, उपयोगकर्ता को अपना लिंग निर्दिष्ट करना होगा (ताकि वर्चुअल सहायक डिवाइस के मालिक से सही ढंग से संपर्क कर सके)। इसके अलावा, यहां आपको मुख्य तापमान स्थितियों (विशेष रूप से, डिग्री केल्विन, फ़ारेनहाइट, या, ज़ाहिर है, सेल्सियस) के लिए माप की इकाई सेट करनी होगी।


प्रदर्शन के ऊपरी कोने में स्थित आइकन को स्पर्श करके निर्देशों की एक विस्तृत सूची पाई जा सकती है। उसी समय, सभी कमांड आवश्यक रूप से "जार्विस" उपचार से शुरू होने चाहिए और इसमें आमतौर पर एक शब्द होता है (उदाहरण के लिए, "जार्विस, मौसम पूर्वानुमान")। इसके अलावा, जार्विस डिवाइस के मालिक को भविष्य की बैठकों के बारे में सूचित कर सकता है और वर्तमान समय प्रदर्शित कर सकता है। आप प्रोग्राम में कई तरह के ऑडियो रिमाइंडर भी बना सकते हैं।

यह ध्यान रखना महत्वपूर्ण है कि जार्विस उपयोगिता आयरन मैन मूवी ब्लॉकबस्टर के साथ ऑप्टिकल डिस्क के मालिकों को अतिरिक्त सुविधाएं प्रदान करती है। उदाहरण के लिए, उपयोगकर्ता इस वर्चुअल बटलर की मदद से संबंधित मूवी के प्लेबैक को आसानी से नियंत्रित कर सकता है।


उपयोगी जानकारी: यदि आप अपने आभासी सहायक से एक प्रश्न पूछते हैं: क्या मुझे बीएमडब्ल्यू 740 (http://www.bmw-avtoport.ru/auto/7/) खरीदना चाहिए, तो उसका उत्तर सौ प्रतिशत संभावना के साथ सकारात्मक होगा! वैसे, आप अभी अपने लिए सबसे अनुकूल शर्तों पर BMW 7 Series खरीद सकते हैं! इसके लिए आपको बस www.bmw-avtoport.ru साइट पर जाना है।

आज हम अपने भाषण के बारे में बात करेंगे। क्या आप एक चाहेंगे आवाज से कंप्यूटर को नियंत्रित करें, उंगलियों की मदद के बिना? और, जैसा कि वे कहते हैं, विचार की शक्ति से! सच है, हम कंप्यूटर को विचार की शक्ति से नियंत्रित नहीं करेंगे, लेकिन आवाज की शक्ति से यह काफी वास्तविक है।

प्रोग्राम टाइप करें- आवाज के माध्यम से कंप्यूटर को नियंत्रित करने के लिए यह सबसे अच्छे सॉफ्टवेयर में से एक है। इस कार्यक्रम की टिप्पणियों में साइटों पर राय मिलती है।

सच है, इसकी कमियां हैं। लेकिन उस पर बाद में। वैसे, यदि आप रुचि रखते हैं, तो मेरी समीक्षा पढ़ें।

आप यहां कार्यक्रम डाउनलोड कर सकते हैं: http://freesoft.ru/type

इसे कैसे उपयोग करे? सबसे पहले, इसे चलाते हैं और मुख्य नियंत्रण बटन देखते हैं:

कार्यक्रम हमारा स्वागत करता है और हमें तुरंत संकेत देता है कि टाइप का उपयोग कैसे करें। शुरुआत में, हम "जोड़ें" बटन दबाएंगे और शब्द लिखेंगे, उदाहरण के लिए, "ओपन"। ऐसा करने के लिए, इस शब्द को माइक्रोफ़ोन में कहें:

फिर जोड़ें पर क्लिक करें। इसलिए, हमने अपनी आवाज से प्रोग्राम में "ओपन" शब्द को सेव किया। आप माइक्रोफ़ोन में कोई अन्य शब्द बोल सकते हैं। मुख्य बात भ्रमित नहीं होना है।

अगला कदम कमांड जोड़ना है। ऐसा करने के लिए, इस बिंदु पर जाएँ:

फिर हम उस वस्तु के बगल में स्थित बॉक्स को चेक करते हैं जिसकी हमें आवश्यकता है:

एक प्रोग्राम, एप्लिकेशन या क्रिया का चयन करें और लाल रिकॉर्ड बटन पर क्लिक करें। अगर कंप्यूटर ने हमारी आवाज स्वीकार कर ली है, तो "जोड़ें" पर क्लिक करें:

और अब हमारी प्रोफाइल में एक वॉयस कमांड दिखाई देगी। इस मामले में, वह जो 7-ज़िप खोलता है:

और अब, अंतिम बटन दबाकर "बात करना शुरू करें"

हम वाक्यांश "ओपन सेवन ज़िप" कहते हैं। मेरे मामले में, सब कुछ काम करेगा। और 7-ज़िप प्रोग्राम खुल जाएगा। यह वाक्यांश याद रखें: सिम सिम खुला? यहाँ उसी के बारे में कुछ है।

कार्यक्रम हमेशा ठीक से काम नहीं करता है। अब शक्तिशाली रूसी भाषा का पूरी तरह से भाषाविद् प्रोग्रामर द्वारा अध्ययन नहीं किया गया है ... लेकिन फिर भी, यह अच्छा है जब कोई कंप्यूटर आपकी बात मानता है।

इसलिए, परीक्षण और सामान्य जिज्ञासा के लिए, टाइप प्रोग्राम 100% उपयुक्त है।

इस वीडियो में आप देख सकते हैं कि पहले वॉयस इंजन के निर्माण का इतिहास और हमें और क्या काम करने की आवश्यकता है:

कार्यक्रम के अन्य एनालॉग्स के ऐसे भयानक नाम हैं जैसे गोरींच, पेरपेटुम, डिक्टोग्राफ, वॉयस कमांडर। लेकिन वे सभी "वह नहीं" हैं। एक योग्य कार्यक्रम की आलोचना को पारित न करें।

इस कार्यक्रम में महारत हासिल करने में मुझे 5 मिनट लगे। यह काफी लंबा समय है (ज्यादातर, मैं ऐसे कार्यक्रमों को 1-2 मिनट में समझ लेता हूं)। यदि आपके कोई प्रश्न हैं - लिखें। जल्द ही मिलते हैं, दोस्तों :)!


बहुत देर तक मेरे "जार्विस" और घर में उपकरणों को अपनी आवाज से नियंत्रित करने का विचार नहीं छोड़ा। और अंत में हाथ इस चमत्कार की रचना तक पहुंचे। मुझे लंबे समय तक "दिमाग" के बारे में नहीं सोचना पड़ा, रास्पबेरी पाई पूरी तरह से फिट बैठती है।

तो लोहा:

  • रास्पबेरी पाई 3 मॉडल बी
  • लॉजिटेक यूएसबी कैमरा

कार्यान्वयन

हमारा सहायक एलेक्सा/हब सिद्धांत के अनुसार काम करेगा:
  1. किसी विशिष्ट शब्द के लिए ऑफ़लाइन सक्रिय करें
  2. क्लाउड में एक टीम को पहचानें
  3. चलाने के आदेश
  4. किए गए कार्य पर रिपोर्ट करें या मांगी गई जानकारी की रिपोर्ट करें
इसलिये मेरा कैमरा बॉक्स के बाहर समर्थित है, मुझे ड्राइवरों के साथ खिलवाड़ नहीं करना पड़ा, इसलिए हम सीधे सॉफ्टवेयर भाग पर जाएंगे।

ऑफ़लाइन सक्रियण

सीएमयू स्फिंक्स का उपयोग करके सक्रियण होगा, और सब कुछ ठीक हो जाएगा, लेकिन बॉक्स की पहचान बहुत धीमी है, 10 सेकंड से अधिक, जो बिल्कुल उपयुक्त नहीं है, समस्या को हल करने के लिए, आपको अनावश्यक शब्दों के शब्दकोश को साफ़ करने की आवश्यकता है।

आपको जो कुछ भी चाहिए उसे स्थापित करना:

pip3 स्पीच रिकॉग्निशन स्थापित करें pip3 पॉकेट्सफिनक्स स्थापित करें
आगे

sudo nano /usr/local/lib/python3.4/dist-packages/speech_Recognition/pocketsphinx-data/en-US /pronounciation-dictionary.dict
जार्विस को छोड़कर हमें जो कुछ भी चाहिए उसे हटा दें:

जार्विस जेएच एए आर वी एएच एस
अब Pocketsphinx बहुत जल्दी पहचान लेता है।

वाक् पहचान

पहले तो Google सेवा का उपयोग करने का विचार था, इसके अलावा, इसका समर्थन स्पीच रिकॉग्निशन में है। लेकिन जैसा कि यह निकला, Google इसके लिए पैसे लेता है और भौतिक के साथ काम नहीं करता है। व्यक्तियों।

सौभाग्य से, यांडेक्स भी ऐसा अवसर प्रदान करता है, नि: शुल्क और बेहद सरल।

रजिस्टर करें, एपीआई कुंजी प्राप्त करें। कर्ल'ओम से सभी काम किए जा सकते हैं।

कर्ल-एक्स पोस्ट-एच "सामग्री-प्रकार: ऑडियो/एक्स-वेव" --डेटा-बाइनरी "@file" "https://asr.yandex.net/asr_xml?uuid=ya_uid&key=yf_api_key&topic=queries"

भाषा संकलन

यहां यांडेक्स फिर से हमारी मदद करेगा। हम प्रतिक्रिया में पाठ भेजते हैं, हमें संश्लेषित पाठ के साथ एक फ़ाइल मिलती है

कर्ल "https://tts.voicetech.yandex.net/generate?format=wav&lang=ru-RU&speaker=zahar&emotion=good&key=ya_api_key" -G --data-urlencode "text=text" > फ़ाइल

जार्विस

हम सब कुछ एक साथ इकट्ठा करते हैं और ऐसी स्क्रिप्ट प्राप्त करते हैं।

#! /usr/bin/env python # -*-कोडिंग:utf-8-*- xml.dom से sr के रूप में इम्पोर्ट स्पीच_रिकग्निशन आयात करें। # os.system("echo "Assist+ent za+en" |festival --tts --language russian") कन्वर्ट_ya_asr_to_key(): xmldoc = minidom.parse(./asr_answer.xml") आइटमलिस्ट = xmldoc.getElementsByTagName ("वैरिएंट") अगर लेन (आइटमलिस्ट)> 0: रिटर्न आइटमलिस्ट.फर्स्ट चाइल्ड.नोडवैल्यू अन्य: रिटर्न फाल्स डेफ jarvis_on (): स्रोत के रूप में sr.WavFile ("send.wav") के साथ: ऑडियो = r.record(source) कोशिश करें: टी = आर। पहचान_स्फिंक्स (ऑडियो) प्रिंट (टी) लुकअप एरर को छोड़कर: प्रिंट ("ऑडियो को समझ नहीं सका") रिटर्न टी == ("जार्विस") def jarvis_say (वाक्यांश): os.system ("कर्ल" https: //tts.voicetech.yandex.net/generate?format=wav&lang=ru-RU&speaker=zahar&emotion=good&key="+ya_api_key+"" -G --data-urlencode "text=" + वाक्यांश + ""> jarvis_speech.wav" ) os.system("aplay jarvis_speech.wav") def jarvis_say_good(): वाक्यांश = ["हो गया", "हो गया", "हां" ", "हां", "क्या कुछ और है?", ] randitem = random.choice(phrases) jarvis_say(randitem) try: जबकि True: os.system("arecord -B --buffer-time=1000000 -f dat -आर 16000 -डी 3-डी प्लगव:10 सेंड.वाव") अगर jarvis_on (): os.system("aplay jarvis_on.wav") os.system("arecord -B --buffer-time=1000000 - f dat -r 16000 -d 3-डी प्लगव: 10 सेंड.wav") os.system("curl -X POST -H "Content-type: audio/x-wav" --data-binary "@send .wav" "https://asr.yandex.net/asr_xml?uuid="+ya_uuid+"&key="+ya_api_key+"&topic=queries" > asr_answer.xml") command_key = Convert_ya_asr_to_key() if (command_key): if (command_key) कमांड_की ['key_word", 'key_word1', 'key_word2"]) में: os.system('') jarvis_say_good() अपवाद को छोड़कर जारी रखें: jarvis_say ("कुछ गलत हो गया")
यहाँ क्या चल रहा है। हम एक अनंत लूप शुरू करते हैं, arecord'om तीन सेकंड लिखता है और फ़ाइल में "जार्विस" शब्द होने पर पहचान के लिए स्फिंक्स भेजता है

अगर jarvis_on ():
हम एक पूर्व-दर्ज सक्रियण अधिसूचना फ़ाइल चलाते हैं।

फिर से हम 3 सेकंड रिकॉर्ड करते हैं और इसे यैंडेक्स को भेजते हैं, जवाब में हमें अपना आदेश मिलता है। अगला, हम कमांड के आधार पर क्रियाएं करते हैं।

बस इतना ही। आप निष्पादन परिदृश्यों की एक महान विविधता के साथ आ सकते हैं।

उदाहरण

अब मेरे वास्तविक उपयोग के कुछ उदाहरण

फिलिप्स ह्यू

इंस्टॉल

पाइप स्थापित फू
ह्यू ऐप में, एक स्थिर आईपी सेट करें:

हम लॉन्च करते हैं:

#!/usr/bin/python import sys from phue import Bridge b = Bridge("192.168.0.100") # यहां ब्रिज आईपी दर्ज करें। #अगर पहली बार चल रहा है, तो ब्रिज पर बटन दबाएं और b.connect() बिना किसी टिप्पणी के #b.connect() प्रिंट (b.get_scene()) के साथ चलाएं।
हम वांछित योजनाओं की आईडी लिखते हैं, जैसे "470d4c3c8-on-0"

अंतिम स्क्रिप्ट:

#!/usr/bin/python import sys from phue import Bridge b = Bridge("192.168.0.100") # यहां ब्रिज आईपी दर्ज करें। #अगर पहली बार चल रहा है, तो ब्रिज पर बटन दबाएं और b.connect() बिना किसी टिप्पणी के साथ चलाएं #b.connect() if (sys.argv == "off"): b.set_light(,"on", False) अन्य: b.active_scene(1,sys.argv)
जार्विस में जोड़ें:

अगर (कमांड_की ["लाइट ऑन करें", "लाइट ऑन करें", "लाइट"]): os.system("python3 /home/pi/smarthome/hue/hue.py a1167aa91-on-0") jarvis_say_good() जारी रखें यदि (कमांड_की ["मंद रोशनी", "मंद रोशनी"]): os.system ("python3 /home/pi/smarthome/hue/hue.py ac637e2f0-on-0") jarvis_say_good( ) जारी रखें अगर (कमांड_की ["लाइट ऑफ", "लाइट ऑफ"] में): os.system("python3 /home/pi/smarthome/hue/hue.py "off"") jarvis_say_good() जारी

एलजी टीवी

हम यहां से स्क्रिप्ट लेते हैं। पहले लॉन्च के बाद और युग्मन कोड दर्ज करने के बाद, कोड स्वयं नहीं बदलता है, इसलिए आप इस भाग को स्क्रिप्ट से काट सकते हैं और केवल नियंत्रण को छोड़ सकते हैं।

जार्विस में जोड़ें:

#1 - पावर #24 - VOLUNE_UP #25 - VOLUME_DOWN #400 - 3D_VIDEO अगर (["टीवी बंद करें", "टीवी बंद करें"] में कमांड_की): os.system("python3 /home/pi/smarthome/TV/ tv2. py 1") jarvis_say_good() जारी रखें अगर (कमांड_की ['वॉल्यूम को चालू करें', "लाउडर"] में): os.system("python3 /home/pi/smarthome/TV/tv2.py 24") jarvis_say_good () जारी रखें

रेडियो

sudo apt-mpg123 स्थापित करें
जार्विस में जोड़ें:

अगर (["समाचार" में कमांड_की, 'समाचार बंद करें', 'क्या चल रहा है']): os.system('mpg123 URL') जारी रखें
यदि आप जार्विस को चिल्ला नहीं सकते हैं, तो आप सिरी के माध्यम से होमब्रिज भी लगा सकते हैं और सब कुछ प्रबंधित कर सकते हैं।

भाषण मान्यता की गुणवत्ता के लिए, निश्चित रूप से एलेक्सा नहीं, बल्कि 5 मीटर तक की दूरी पर, सही हिट का प्रतिशत सभ्य है। मुख्य समस्या यह है कि टीवी / स्पीकर से भाषण कमांड के साथ रिकॉर्ड किया जाता है और मान्यता में हस्तक्षेप करता है।

बस इतना ही, धन्यवाद।

टैग:

  • रास्पबेरी पाई
  • अजगर
टैग लगा दो
लोड हो रहा है...लोड हो रहा है...