Ptát se vás, jestli vám něco říká slovo Siri, určitě nemusím. Jedná se o hlasovou asistentku, která vám v iPhone 4S zodpoví prakticky jakýkoli dotaz. Za jejím vývojem stojí americká společnost Nuance Communications. A právě tato společnost vyvinula dvě aplikace pro iOS, které stejně jako Siri umí rozpoznat, co jim říkáte. Na rozdíl od Siri vám ale nic neodpoví...
Tyto dvě aplikace jsou zajímavé hlavně tím, že podporují na rozdíl od Siri i češtinu. Jedná se o Dragon Dictation, ta umí převést na text delší řeč a Dragon Search, který vyhledá vyřčené slovo (či více slov) v některém z internetových vyhledávačů.
Dragon Dictation
Aplikace Dragon Dictation slouží jako náhrada sekretářky, dokáže přepsat vaši řeč do textu. Funguje podobně jako Siri, to znamená že na telefonu namluvíte co potřebujete a zvuková stopa bude posléze odeslána na server. Server zajistí převod řeči na text a odešle vám ho zpět do telefonu. Nejedná se tedy o aplikaci, která by nějakým chytrým algoritmem překládala řeč na text přímo v telefonu, pro její použití je nutné mobilní datové připojení nebo Wi-fi síť.
Rozhraní aplikace je velmi jednoduché, tvoří ho víceméně jen dvě obrazovky. Na té první je stříbrnočervené tlačítko, které když zmáčknete, můžete hovořit. Konec vaší řeči je možné nechat detekovat automaticky, nebo ho ukončit stiskem tlačítka.
Výsledný rozpoznaný text bude zobrazen v okně na další obrazovce. Odtud ho můžete zkopírovat do systémové schránky a následně ho vložit do jiné aplikace. Je zde i možnost ho odeslat e-mailem, SMS či ho publikovat na Facebooku nebo Twitteru. Okno s textem je editovatelné, můžete do něj tedy i něco dopsat na integrované klávesnici.
Chcete-li diktovat hodně dlouhý text, nemusíte ho odříkat najednou. Při každém dalším rozpoznání se text doplní za ten stávající.
Stáhnout zdarma Dragon Dictation
Dragon Search
Dragon Search je taktéž aplikace od společnosti Nuance Communications, je zaměřená vyloženě jen na vyhledávání. Jejím základem je opět rozpoznávací hlasový modul, který vaši řeč přepíše na text, ten pak vloží do vyhledávače. Vy uvidíte na displeji rovnou výsledky vašeho dotazu.
V nastavení aplikace si máte možnost zvolit, který z vyhledávačů bude použitý jako výchozí. Na výběr je Google a Yahoo, tím ale možnosti aplikace nekončí. Po rozpoznání textu si můžete mimo těchto dvou vybrat ještě hledání na Wikipedii, Twitteru, YouTube a iTunes.
Princip fungování je totožný, jako u Dragon Dictation, jen s tím rozdílem, že výsledný text je rovnou vložen do vyhledávacího políčka. Vedle něj je tlačítko symbolizující nahrávání, kterým můžete rychle spustit další rozpoznávání a nemusíte se vracet na výchozí obrazovku.
Jaká je kvalita převodu? Funguje to, ale sekretářku nenahradí
U krátkých textů v Dragon Search je kvalita převodu poměrně hodně vydařená. Většinou vyhledáváte jedno slovo, případně kratší slovní spojení a Dragon Search v tomto případě téměř nezklamal, problémy mu dělaly jen nějaká delší a složitější slova (například "velrybářská výprava"), ne vždy je korektně rozeznal.
Dragon Dictation dopadl v testu hůře. Zde se očekává, že vám převede z hlasu na text delší bloky řeči. Zkusil jsem přečíst postupně několik odstavců z našich článků o telefonech a kvalita převodu byla průměrná až podprůměrná, v textu bylo hodně chyb. Líbí se mi ale, že když na konkrétní slovo posléze ukážete, aplikace vám nabídne slovo jiné. Taky jsem byl příjemně překvapen, že vyřčená čísla se zapsala opravdu jako čísla, aplikace správně rozeznala také například slovo "megapixelů" a udělala z něj "Mpx".
Dragon Dictation vs. Android – ukázka rozpoznávání hlasu v češtině
A jak dopadl Dragon Search a Dragon Dictation v porovnání s hlasovým rozpoznáváním Google na Androidu? U jednoslovných či několikaslovných spojení zadávaných do vyhledávače si vedl lépe Google, dovedl i složitější slova přesněji identifikovat. Naopak v případě diktování delšího textu byl dle mých testů ve výsledku lepší Dragon Dictation.
Jak jsem už ale psal, sekretářku vám toto rozpoznávání mluveného textu nenahradí. Výsledné opravy textu zabraly více času, než kdybych si diktovaný text rovnou psal na klávesnici notebooku či počítače. V tomto ohledu se musí "umělá inteligence" ještě hodně učit, věřím že v anglickém jazyce by dopadlo rozpoznání mnohem lépe. Čeština je hodně složitý jazyk a určitě není prioritou pro vývojáře.
Používáte rozpoznávání textu z řeči? Na jaké platformě a pro jaké účely nejvíce? Co myslíte, znamená podpora češtiny v těchto aplikacích to, že se brzy objeví Siri i našem jazyce? Vznikla tato aplikace proto, aby Nuance Communications získala co největší množství hlasových vzorků z jiných jazyků?