Výzva pro vývojáře: český hlasový syntetizátor pro Mac OS X!

9. 03. 2005, 2:48 · Nakousnutá jabka

ikonkaVčera mě Patrick Zandl upozornil na velice zajímavou aplikaci – český hlasový syntetizátor Epos s (minimálně pro mě) velmi překvapivou hlasovou kvalitou (ukázka českého textu – závěr recenze na Mac mini, kterou jsem napsal včera pro PC World ;). Jestliže znáte TTS (text-to-speech) zabudovaný v Mac OS X a porovnáte si kvalitu výstupu z Eposu, zjistíte, že rozdíl v kvalitě je propastný – ve prospěch českého řešení! Pokud si chcete hrát, můžete si vyzkoušet sami převod přímo na webu, ale co je ještě lepší, celý systém je vyvíjený jako open-source, který lze podle všeho zkompilovat i pod Unixy. Přiznám se, nejsem ani trochu programátor, a tak nejsem schopen si to zkompilovat sám, a především – myslím si, že velmi užitečné by bylo zjistit, zda jde do systému implementovat tento hlasový výstup jako další “hlas” pro systémové TTS. Jelikož od Tigera bude součástí systému kompletní screenreader pro zrakově postižené (který normálně na Windows stojí jako samostatná aplikace 1000 USD), bylo by podobné řešení skvělým řešením pro postižené.

Skvělý hlasový syntetizátor existuje, najde se dost ochotných programátorů, kteří by se dali dohromady a pokusí se o implementaci do Mac OS X?

Mimochodem, netušíte zda jsou na českém webu pohádky v textové podobě? Přítelkyni jsem dneska večer po koncertu RoPy zcela vyčerpal tím, že jsem jí zabavil její PC a posadil k Macu mini a nechal jí do tří do noci zápolit se Safari, Finderem, Proteusem a podobně – tak jsem ji chtěl na dobrou noc alespoň nechat predčítat nějakou pohádku ;), ať mohu v klidu psát na blog, ale smůla :(.

Update: pro praktickou ukázku toho, co jde se systémem generování a rozpoznávání řeči udělat si zavolejte sem: 485 353 100 – Liberecky hlasový informační systém Infocity.

Update 2: jelikož se strhla relativně nepodstatná diskuse o mém názoru, že Epos má kvalitnější výstup, přidávám ještě ukázku systémového TTS s hlasem Victoria, a pro ilustraci také ten samý text v systému od Acapela a ukázku polštiny navrch. Nutno podotknout, že to co produkuje Acapela ještě o třídu až dvě jinde.

Trvalý odkaz na tento příspěvěk

  1. No, pokud se za posledni cca rok nic nezmenilo, nejde to na macu zkompilovat. Na druhou stranu by na tom nemuselo byt prilis mnoho prace, autor se snad snazil o nejakou podporu big endian. Mluvilo se o tom v diskusi na MujMacu/Programovani pro Mac OS X.

    — nemo    9.3.2005 09:35    #

  2. Hm, pohádek se na českém internetu válí dost… Třeba tahle:
    http://www.cssd.cz/vismo/zobraz_dok.asp?u=422010&id_org=422010&id_ktg=3838&p1=7161&p2=&p3=

    — JJ    9.3.2005 10:31    #

  3. ...tak pokud jde o tu kvalitu hlasu, zase takový velký rozdíl mezi tím co je v Mac OS X nyní a tímhle tedy podle mě není (je to jako Victoria)—pravou však je, že je to zatím nejlepší syntéza českého jazyka jakou jsem kdy slyšel—například nyní používané programy pro slepce na Woknech mluví česky naprosto nesrozumitelně a příšerně “počítačově”—něco jako Zarvox ;–)

    — agent    9.3.2005 10:40    #

  4. Zkus tohle:
    http://www.geocities.com/Athens/Rhodes/8895/index.htm

    — Cisa    9.3.2005 11:29    #

  5. agent: sorry, ale nemohu s tebou souhlasit. pravda, nemohl jsem testovat na shodnem vzorku, protoze Epos nema na webu podporu anglictiny, ale testoval jsem to tady na pritelkyni a rozdil je nebetycny nejen dle meho nazoru, ale i dle jejiho… ten TTS v Mac OS X proste ma takove “upadle” zacatky slov, nevyrazne samohlasky a pod… strasne to sici. tohle je nebe a dudy.

    Martin Lér    9.3.2005 12:26    #

  6. Martin Lér—přijde mi to vážně skoro stejné… jediný rozdíl je, že je to česky—schválně jsem si to ještě porovnal, ale maximálně je to NEPATRNÄš lepší, ale netroufl bych si hovořit o “propastném” rozdílu… každopádně to nic nemění na tom, že tohle mít pro Mac OS X by bylo VĂŤCE NEŽ FANTASTICKÉ!

    — agent    9.3.2005 12:45    #

  7. ad >>ten TTS v Mac OS X proste ma takove "upadle" zacatky slov, nevyrazne samohlasky a pod… strasne to sici. tohle je nebe a dudy.

    — pixy    9.3.2005 13:53    #

  8. ad ”... ten TTS v Mac OS X proste ma takove ‘upadle’ zacatky slov, nevyrazne samohlasky a pod… strasne to sici. tohle je nebe a dudy…”

    Malére, a není to náhodou prostě jen tím, že nejsi rodilý anglický mluvčí? Nezpomínej, že čeština má vždy přízvučnou první slabiku (narozdíl od angličtiny), proto ti můžou připadat začátky slov polykané; samohlásky jsou v angličtině podružné (a navíc úplně jiné než v češtině), proto anglický syntezátor klade větší důraz na srozumitelnost souhlásek – češtině bez samohlásek bys nerozuměl (to už spíš bez souhlásek), zatímco u angličtiny je to přesně naopak. Já myslím, že rodilému mluvčímu zní macovský TTS (přinejmenším) stejně dobře jako nám tenhle český. Skoro bych se vsadil.

    (Co mi to udělalo? U předchozího příspěvku zbyl jen první odstavec a zbytek to uřízlo… :-O )

    — pixy    9.3.2005 13:55    #

  9. Nejsem rodily mluvci, to mas samozrejme pravdu – ale kdyz uz rejes, poslechl sis alespon oba? Mimo to, mam docela zkusenosti i s jazyky, ktere maji prizvucnou jinou nez prvni slabiku – vyrustal jsem v polsku. A jak rikam, netestoval jsem to jen na sobe, i na pritelkyni, ktera hovori anglicky rozhodne vyrazne lepe nez ja. To co pada z TTS v systemu je proste “neklidne” – polyka to samohlasky, velmi tam skace hlasitost jednotlivych pismen a podobne – posloucha se to spatne. Pro ilustraci jsem do clanku pridal jak ukazku toho, co leze z tts, tak ukazku hlasu od firmy Acapela (maji i jakousi verzi v cestine, ale jen pro Windoze a ne na webu, kvalita polstiny me vsak prekvapila hodne) – kazdopadne ten system od Acapela nakope zadek jak systemovemu TTS, tak Eposu.

    Ovsem – vase obhajoba systemoveho TTS je v tomto pripade naprosto irelevantni, nebot to je nasim uzivatelum ve vetsine pripadu jaksi na prd – dulezite je, aby se dal Epos zkompilovat pro Maca a pripadne integrovat do systému, a to je to, o co mi bezi primarne. Skoda ze se chytate podruznosti.

    Martin Lér    9.3.2005 15:07    #

  10. Ale jasně, Epos na Macu by byl rozhodně super, o tom žádná :) Ale podružnosti stojí taky za zmínku :)))

    — pixy    9.3.2005 18:08    #

  11. Maler: ono to skompilovat nebude take jednoduche, to za a.), za b.) skompilovat neznamena, ze to bude podporovane Speech Managerom :)

    To chce vela roboty taketo nieco…

    — Jozo Remen    9.3.2005 20:05    #

  12. Jozo: ufff, jeste nejake novinky? Uvedomuju si oboje, kdyby to nebyl takovy problem, udelam si to sam a nepisu tady o tom.

    Martin Lér    9.3.2005 20:14    #

  13. No, ta kompilace tak velky problem byt nemusi, zda se, ze tvurci jsou ochotni pomoci:

    “Consider downloading 2.5 instead, although it is still beta – we can help you compile it on your thrilling big endian hardware or whatever.”

    Integrace—to je jina. Ovsem udelat pro zacatek treba jen primitivni Service dostupny ve vsech Cocoa aplikacich tezke neni.

    — nemo    9.3.2005 20:26    #

  14. Tak. ALe zda se, ze asi si to nakonec budu muset muset zkusit zkompilovat sam, vsichni jen povidaj. no nic, jdu tahat aktualni xcode…

    Martin Lér    9.3.2005 21:16    #

  15. Ahoj,
    mam ted dost jinych veci, ale pokud uz jsou vyresene endian-problemy (ktere bych v cizim programu fakt resit nechtel), mozna se na to mrknu a uvidim, zda je to vubec v mych silach. Predpokladam, ze to se stahovanim Xcode byl vtip(?) – tak jednoduche to zas nebude;)).

    (K hlasum: Me je Victoria prijemnejsi nez ten EPOS, sice je cvrlikavejsi, ale celkove ma tak nejak zivejsi a prirozenejsi vyslovnost a lepsi melodii vety. Rozhodne ale nepolyka zacatky ani nic jineho, se skoky v hlasitosti mas pravdu. Ta Acapela v anglictine je ale s obojim nesrovnatelna.)

    Adam Nohejl    9.3.2005 22:30    #

  16. Adam: no, možná Malér nemá instalovanou tu “lepší” verzi—nevím jestli jsou ty tři vylepšené hlasové moduly (mimo jiné Victoria) ve standardní instalaci—já si je vždy zapínal při instalaci manuálně... jinak si to neumím vysvětlit, protože já tam také žádný velký rozdíl ve prospěch EPOS nezaznamenal… (ale znovu říkám—na PC jsem ještě nikdy neslyšel lepší českou výslovnost)

    — agent    10.3.2005 00:22    #

  17. asi pred polrokem jsme to skouseli skompilovat na PPC (mam asi vsechny pokracovani “stoparuv pruvodce galaxii” v .doc) dokonce jsem chvili uvazoval ze si koupim nejaky x86 system, nainstalujem linux :)

    — gluon    10.3.2005 00:58    #

  18. Adam: no vtip to neni, kazdy zacatek je tezky ;))

    Agent: to zda mam jiny hlas nez ty poznas snadno, kdyz si poslechnes tu ukazku z TTS kterou jsem sem hodil.

    Martin Lér    10.3.2005 01:34    #

  19. k hlasum(ja jsem ta vyse zminovana pritelkyne) : mne pripadal nejvetsi rozdil prave v tom, ze TTS melo ruznou hlasitost slabik ve slovech bez zavislosti na prizvuku. K anglictine rodileho mluvciho mam hodne daleko, nicmene neco malo o ni tusim a (i logicky) by prizvucna slabika mela byt tou nejhlasitejsi. V TTS to tak nebylo, proto je tomu hure rozumet, prijde mi, ze se prizvuk timto jakoby ztraci.

    — Piskovec    10.3.2005 18:25    #

Související články