Dragon Dictation: vyzkoušeli jsme rozpoznávání českého hlasu (iOS)

Dnes vám představíme dvojici aplikací od společnosti Nuance Communications, která stojí za populární virtuální asistentkou Siri. Obě aplikace umí rozeznat vaši řeč a převést ji na text. Oproti Siri mají plnou podporu češtiny a stáhnout a používat je můžete zcela zdarma.

Ptát se vás, jestli vám něco říká slovo Siri, určitě nemusím. Jedná se o hlasovou asistentku, která vám v iPhone 4S zodpoví prakticky jakýkoli dotaz. Za jejím vývojem stojí americká společnost Nuance Communications. A právě tato společnost vyvinula dvě aplikace pro iOS, které stejně jako Siri umí rozpoznat, co jim říkáte. Na rozdíl od Siri vám ale nic neodpoví...

iPhone 4S a Siri

Tyto dvě aplikace jsou zajímavé hlavně tím, že podporují na rozdíl od Siri i češtinu. Jedná se o Dragon Dictation, ta umí převést na text delší řeč a Dragon Search, který vyhledá vyřčené slovo (či více slov) v některém z internetových vyhledávačů.

Dragon Dictation

Aplikace Dragon Dictation slouží jako náhrada sekretářky, dokáže přepsat vaši řeč do textu. Funguje podobně jako Siri, to znamená že na telefonu namluvíte co potřebujete a zvuková stopa bude posléze odeslána na server. Server zajistí převod řeči na text a odešle vám ho zpět do telefonu. Nejedná se tedy o aplikaci, která by nějakým chytrým algoritmem překládala řeč na text přímo v telefonu, pro její použití je nutné mobilní datové připojení nebo Wi-fi síť.

Dragon Dictation

Rozhraní aplikace je velmi jednoduché, tvoří ho víceméně jen dvě obrazovky. Na té první je stříbrnočervené tlačítko, které když zmáčknete, můžete hovořit. Konec vaší řeči je možné nechat detekovat automaticky, nebo ho ukončit stiskem tlačítka.

Výsledný rozpoznaný text bude zobrazen v okně na další obrazovce. Odtud ho můžete zkopírovat do systémové schránky a následně ho vložit do jiné aplikace. Je zde i možnost ho odeslat e-mailem, SMS či ho publikovat na Facebooku nebo Twitteru. Okno s textem je editovatelné, můžete do něj tedy i něco dopsat na integrované klávesnici.

Dragon Dictation

Chcete-li diktovat hodně dlouhý text, nemusíte ho odříkat najednou. Při každém dalším rozpoznání se text doplní za ten stávající.

Stáhnout zdarma Dragon Dictation

Dragon Search

Dragon Search je taktéž aplikace od společnosti Nuance Communications, je zaměřená vyloženě jen na vyhledávání. Jejím základem je opět rozpoznávací hlasový modul, který vaši řeč přepíše na text, ten pak vloží do vyhledávače. Vy uvidíte na displeji rovnou výsledky vašeho dotazu.

Dragon Search

V nastavení aplikace si máte možnost zvolit, který z vyhledávačů bude použitý jako výchozí. Na výběr je Google a Yahoo, tím ale možnosti aplikace nekončí. Po rozpoznání textu si můžete mimo těchto dvou vybrat ještě hledání na Wikipedii, Twitteru, YouTube a iTunes.

Dragon Search

Princip fungování je totožný, jako u Dragon Dictation, jen s tím rozdílem, že výsledný text je rovnou vložen do vyhledávacího políčka. Vedle něj je tlačítko symbolizující nahrávání, kterým můžete rychle spustit další rozpoznávání a nemusíte se vracet na výchozí obrazovku.

Stáhnout zdarma Dragon Search

Jaká je kvalita převodu? Funguje to, ale sekretářku nenahradí

U krátkých textů v Dragon Search je kvalita převodu poměrně hodně vydařená. Většinou vyhledáváte jedno slovo, případně kratší slovní spojení a Dragon Search v tomto případě téměř nezklamal, problémy mu dělaly jen nějaká delší a složitější slova (například "velrybářská výprava"), ne vždy je korektně rozeznal.

Dragon Dictation

Dragon Dictation dopadl v testu hůře. Zde se očekává, že vám převede z hlasu na text delší bloky řeči. Zkusil jsem přečíst postupně několik odstavců z našich článků o telefonech a kvalita převodu byla průměrná až podprůměrná, v textu bylo hodně chyb. Líbí se mi ale, že když na konkrétní slovo posléze ukážete, aplikace vám nabídne slovo jiné. Taky jsem byl příjemně překvapen, že vyřčená čísla se zapsala opravdu jako čísla, aplikace správně rozeznala také například slovo "megapixelů" a udělala z něj "Mpx".

Dragon Dictation vs. Android – ukázka rozpoznávání hlasu v češtině

A jak dopadl Dragon Search a Dragon Dictation v porovnání s hlasovým rozpoznáváním Google na Androidu? U jednoslovných či několikaslovných spojení zadávaných do vyhledávače si vedl lépe Google, dovedl i složitější slova přesněji identifikovat. Naopak v případě diktování delšího textu byl dle mých testů ve výsledku lepší Dragon Dictation.

Rozpoznávaní řeči od Google

Jak jsem už ale psal, sekretářku vám toto rozpoznávání mluveného textu nenahradí. Výsledné opravy textu zabraly více času, než kdybych si diktovaný text rovnou psal na klávesnici notebooku či počítače. V tomto ohledu se musí "umělá inteligence" ještě hodně učit, věřím že v anglickém jazyce by dopadlo rozpoznání mnohem lépe. Čeština je hodně složitý jazyk a určitě není prioritou pro vývojáře.

Používáte rozpoznávání textu z řeči? Na jaké platformě a pro jaké účely nejvíce? Co myslíte, znamená podpora češtiny v těchto aplikacích to, že se brzy objeví Siri i našem jazyce? Vznikla tato aplikace proto, aby Nuance Communications získala co největší množství hlasových vzorků z jiných jazyků?