Váš hlas už nebude váš

29. červenec 2018

V Americe se pomalu chystá premiéra robota ve vysílání, který by mohl plně nahradit moderátora. Robotický hlas se jmenuje Jamie Dupree 2.0 a o tom, co řekne, rozhoduje lidská předloha stejného jména - zkušený americký rozhlasový reportér Jamie Dupree.

Když Český rozhlas slavil 95. narozeniny, bavili jsme se ve vysílání Plusu s moderátorem Janem Bumbou o budoucnosti rádia. Došlo i na to, zdali Jana jednou nahradí robot. Odpověděl jsem mu, že může být v klidu. Ačkoli se technologie skokově vyvíjejí, nahradit moderátora je extrémně těžké. Schopnost opravdové konverzace má u strojů své limity a ani výslovnost není ideální - roboti zatím neumějí dobře pracovat s hlasem, měnit příhodně intonaci, přejít do dramatičtější nebo naopak humornější polohy a tak dále.

Jenže v téže době se v Americe pomalu chystala premiéra jednoho takového „robota" ve vysílání. Obavy Jana Bumby se sice zdaleka nenaplnily, ale příběh je to fascinující. Robotický hlas se jmenuje Jamie Dupree 2.0 a o tom, co řekne, rozhoduje jeho lidská předloha stejného jména - zkušený americký rozhlasový reportér Jamie Dupree. Toho totiž před pár lety potkala profesní tragédie. Záhadná nemoc způsobila, že téměř ztratil schopnost mluvit. Dokáže říct konkrétní slovo či dvě, ale o mnoho víc jich naráz neposkládá. Běhal po doktorech a zamotával jim hlavy. Nakonec se sice našla diagnóza (neurologické onemocnění dystonie jazyka), ale léčba bohužel nikoli. Z Dupreeho tak byl rozhlasový reportér bez hlasu.

Se svou situací se nesmířil. Pracoval dál - nahrával pro vysílání reakce politiků, otázky jim kladl písemně. Zkoušel různé léčebné postupy. Ale vůbec nic nepomohlo a ani dnes není zdaleka jasné, zda se kdy uzdraví. Takže přišla ke slovu technika. Dupree se spojil s firmou CereProc, která vám za pět set liber vytvoří váš vlastní strojový hlas. K tomu ale musí zájemci namluvit specifickou sadu vět. To u Dupreeho nebylo možné, a tak se začal hrabat ve stovkách svých starých reportáží a vystřihával svůj hlas.

Tuto „zásobárnu" pak vzali vývojáři a jejich neuronová síť’ vytvořila napodobeninu Dupreeho hlasu. Hlas je stále relativně robotický a nelze s ním mluvit v reálném čase, ale na malý návrat do vysílání to stačí. Dupree svůj příspěvek napíše, program nad modelem jeho hlasu vytvoří zvukový soubor a ten Dupree zakomponuje do své reportáže. Jamie doufá, že technologie se budou dále zlepšovat a hlas se přiblíží originálu. V tom má zcela jistě pravdu. Chytří asistenti od Googlu či Amazonu jsou díky velkému kapitálu za zády už teď o dost blíže ideálu než hlas od CereProc. Ale i CereProc dál experimentuje. Jeden pokus je obzvlášť pozoruhodný a pro nás bude odrazovým můstkem k tomu, jak si pěkný příběh trochu pokazit.

CereProc vzal 831 nahrávek projevů J. F. Kennedyho a vytvořil díky nim onen projev, který Kennedy napsal, ale v Dallasu už pronést nestihl. Tím se dostáváme na tenký led. Najednou jsme od využití technologie na dohled k jejímu zneužití. Budeme si muset zvyknout na dobu, kdy lze zmanipulovat nejen fotografie, ale i zvuk nebo video. Před pár měsíci vyvolala pozdvižení takzvaná deepfake videa. Tvůrci vzali existující video a pomocí programu v něm poměrně věrohodně vyměnili tváře. Asi netřeba dodávat, že největší pozornost přitáhly snímky „pro dospělé", kde tváře pornohereček vystřídaly obličeje hollywoodských hvězd. Projekt Deep Voice zase hlásá, že k napodobení lidského hlasu mu stačí necelé čtyři sekundy originálních nahrávek. Tvorba takových falz je zatím technicky i časově náročná, ale to se časem změní. Čeká nás spousta dobrých užití, velmi sporných momentů (představte si nové hry s hlasem Karla Hogera - a vás jistě již napadá, co je na tom hezké i zvrácené) a jednoznačných průšvihů.

Dupree se tedy brzy dočká verze 3.0, avšak my se připravme na to, že je tu další technologie, která rozbombarduje stávající pravidla, a my budeme bolestivě kolíkovat nové hřiště.

autor: Adam Javůrek
Spustit audio

Více o tématu