Byla to jedna z mých oblíbených funkcí. Při delším podržení tlačítek na sluchátkách se v nich ozvalo pípnutí a spustilo se hlasové ovládání. Repertoár jeho znalostí je sice velmi omezený a s anglicky mluvícím Asistentem se vůbec nedá srovnávat, ale fungovalo spolehlivě. Člověk mohl vytočit číslo, zeptat se na počasí nebo přesný čas. Někdy v průběhu prázdnin jsem zjistil, že tato funkce je pryč. Dlouhý stisk nefunguje, bez ohledu na připojené zařízení nebo značku telefonu. Po delším laborování jsem zjistil, kde leží jádro pudla. Tato funkce je po některé z aktualizací aplikace Google vyhrazena pouze Asistentovi. Pokud ho máte deaktivovaného, aby se „nebil“ se starším hlasovým ovládáním, pak se nestane vůbec nic.
Abyste se nyní dostali k hlasovému ovládání, je potřeba odemknout telefon a stisknout ikonku mikrofonu ve widgetu nebo aplikaci. To ale naprosto postrádá smysl, protože pak je rychlejší provést danou akci přímo. Tato chyba ve mně zanechává pocit obzvláštní trpkosti. Je totiž vyvrcholením dlouhodobého trendu, kdy vedle sebe existují dva způsoby hlasového ovládání telefonů s Androidem. Jeden míří vzhůru ke hvězdám a druhý se válí někde v blátě. Hlasové ovládání přes sluchátka a reproduktory je totiž už několikátý způsob, který se „rozbil“. Jasně si vybavuji, jak jsem někdy před pěti lety bavil lidi na vánočním večírku posíláním textovek pouhým diktováním do hodinek, tehdy ještě s Android Wear. Tato možnost od určité aktualizace zmizela, respektive hodinky si snaží vyprosit nějaké oprávnění, které nikdy nedostanou.
Poslední video s miliardou zhlédnutí ukazuje, proč bychom neměli všemu věřit – Glosa
Další obdobnou kapitolou je Android Auto. Dokud jsem ho používal pokoutně jako stažené „ápékáčko“, pak jsem byl k jeho nedostatkům shovívavý. Když jsem na konci roku 2020 dorazil oficiálně, člověk by čekal, že bude otázka češtiny alespoň nějak vyřešená. Android Auto je totiž na hlasové interakci z důvodů bezpečnosti přímo postaven. A realita? Když má AA dobrý den, tak nejprve s americkým přízvukem oznámí „nevím, jak vám mohu pomoci“, načež si vzpomene, že česky trochu umí a nabídne seznam cílů. Mnohdy se však neděje nic.
Copak chci tak moc?
Google paradoxně rozumí česky moc dobře. Nejenže tu máme staré hlasové ovládání, ale také aplikaci Okamžitý přepis pro neslyšící. Ta umí fantastickým způsobem zachytit diktovaný text a s pravopisem a interpunkcí si poradí lépe než leckterý rodilý Čech.
Takže by stačilo tak málo, tyto dvě funkcionality vzít a formálně je integrovat do Google Asistenta. Soudnému člověku by pak bylo zcela jasné, že to český Asistent neumí tolik jako americký Asistent. Ostatně ani nemám potřebu, aby mi prohlížel kalendář a volal mým jménem k zubaři, aby mě objednal na další prohlídku.
Nemám potřebu, aby mi Asistent prohlížel kalendář a volal mým jménem k zubaři, aby mě objednal na další prohlídku.
Možná to jako neprogramátor vidím moc jednoduše a možná by taková věc stála daleko víc úsilí, než kolik může malá a chudá česky mluvící komunita zaplatit. Ale pořád se nemůžu zbavit pocitu, že Google naši zemi nějak povýšeně přehlíží, když oficiálně nepodporuje nebo dokonce blokuje funkce, které by mohly normálně běžet. Vedle již zmiňovaného Android Auto to byly také platby chytrými hodinkami s Wear OS. Skončit nelze jinak než pesimisticky. Zatímco loni to vypadalo poměrně nadějně, letos je podobných spekulací a náznaků o poznání méně.
Chtit vsechno zadarmo a bez prispeni je docela troufale.
Po tom co mam doma bednicku s asistentem taky touzim dlouhorocne po cestine...
Jako programator jsem uz nevydrzel a rozhodl se udelat si asistenta sam.
Tu jsem pochopil oc jde.
Skuste si najit neplaceny speech recognition toolkit v cestine, garantuju ze jich naleznete malo a kdyz chcete source code a jeste na android tak je to mizive procento a vetsinou naleznete jen nektery z nasledovnych:
- nuance (moc drahy)
- deepspeech mozilla (mrtvy kod, mozilla projekt pohrbila)
- tensorflow (tohle pouziva google, a zprovozneni vyzaduje akademicky titul z it)
- kaldi (chybi cestina, i kdyz pokusy na rpi jsou)
(jeste asi zopar starych systemu, ktere by uz dnes malokdo pouzil)
Asi nebude ani tak chybou vyvojaru jako neochoty a nezajmu ceske republiky namluvit ceskej jazyk jak do speech recognition, kde je potreba umelou inteligenci natrenovat, tak pro stt, ktere v cestine taky zadarmo neexistuje a neni dostupne ani vyvojarum, natoz beznym lidem.
Problem vidim tedy spis v tom, ze stt a tts v cestine, celkovy pocet funkcnich reseni napocitate na jedne ruce a na deseti rukach nespocitate pocet hodin stravenych rozbehanim experimentalnich systemu a nebo hledanim hlasoveho modelu a penize, ktere jste museli do toho investovat.
Neni divu ze nikdo o to nema zajem.
Na celem svete se ceskemu a slovenskemu stt a tts venuje asi 20 lidi, 21 vcetne mne a vetsinou to nejsou cesi (vcetne mne).
Uznejte ze namluvit cestinu anebo dat jako projekt slovakovi nebo americanovi je nesmysl.
Mno a co se tyce assistenta, tak on jeste pouziva actions, coz je jekesi kontextove modelovani akci a odpovedi.
Ceska mentalita a mysleni je uplne jine a tudiz i tohle musi udelat ceska strana, nemalo americkych reseni je nevhodnych nebo usmevnych...
Pokud se do systemu ceskeho stt a tts neobuje ceska republika, tak ani za 10 let se stav nezlepsi.
Ak by mel nekdo zajem tak Ja taky pracuju na slovenske a ceske open source offline verzi assistenta, chybi mi nekdo bez recove vady a slangu a akcentu co by namluvil cestinu do aplikaci, a zadarmo, jakozto jde o open source.
je potreba si na to najit hodne casu a oprasit slabikar ;)