Malé procento sečtených okrsků stačí predikčním modelům a předpoví, koho uvidíme v druhém kolem prezidentské volby

14. leden 2023

Brzy po uzavření volebních místností mychom už mohli mít představu o tom, kdo postoupí do druhého kola. A nebudeme muset ani čekat na to, až komise spočítají všechny hlasy. Už při několika procentech sečtených okrsků totiž dokáží konečné výsledky předpovědět speciální predikční modely. Jeden takový má i náš zpravodajský server iRozhlas.cz.

Jiří Špaček, projektový manažer serveru iRozhlas.cz, mi v newsroomu tohoto zpravodajského webu na počítači ukazuje model predikce výsledků prezidentských voleb „Každý, kdo nám na web přijde, se může dívat, jak to průběžně odhaduje konečné výsledky, a to už od sečtení 5 procent okrsků. Poté se odhady s každými dalšími pěti procenty zpřesňují.“

Na tomhle rozhlasovém projektu pracovali také vědci z matfyzu na Univerzitě Karlově. Model tak funguje na základě klasické statistické metody.

„Odhaduje pravděpodobnost, vychází z toho, jak se volilo v minulých letech, sbírá výsledky z jednotlivých okrsků a ty vlastně srovnává s tím, jak se to z těchto okrsků vyvíjelo dál. Postupně to dočítá a zpřesňuje. Když byly parlamentní volby, tak se to docela povedlo,“ doplňuje Jiří Špaček.

Jiný přístup

Teď už jsme jinde a to v sídle softwarové firmy Blindspot v pražském Karlíně. Také ona má vlastní model. Založený je na trochu jiném principu.

„Je to model strojového učení, který se učí transformaci sentimentu z historických voleb do nových voleb,“ vysvětluje mi zdejší vedoucí projektů v oboru umělé inteligence Jiří Čermák.

„Učí se čistě na základě dat, která získáváme, a není v tom žádná korekce expertního názoru,“ dodává ještě.

Zatím vidíme cvičná jména, cvičné grafy, ale takhle to bude vypadat: „Ano, nahrajeme skutečné fotografie kandidátů, jejich jména, to už je jenom poslední konfigurace, která je velmi rychlá. Výsledky budou k vidění na webu volby.blindspot.ai,“ popisuje Jiří Čermák poslední úpravy.

Druhá kola jsou jednodušší

Když se podíváme do minulosti, tak při druhém kole prezidentských voleb váš predikční model předpověděl finální výsledky s chybou pod jeden procentní bod už při sečtení 3 % volebních okrsků: „To je extrémně dobré. Samozřejmě to druhé kolo je jednodušší, protože už tam jsou jen dva subjekty.“

Vůbec poprvé při ostrých volbách tenhle model fungoval právě před 5 lety. Od té doby ho vývojáři neustále vylepšují. Reagovat musí nejen na změny okrsků, které během let v Česku nastaly.

„Data se stále vyvíjejí, doplňuje další informace o okrscích, rozšiřujeme jejich vlastnosti o počet obyvatel a tak dále.“

Klíčová jsou přesná data

Aby ale veškeré modely fungovaly co nejpřesněji, potřebují přesná a rychlá data. Ty poskytuje přímo ze zpracovatelského sálu Český statistický úřad. Online je může sledovat každý na webu. Zpravodajské servery, anebo právě třeba vývojáři modelů je ale získávají vlastní cestou.

„Aby i při potenciální nefunkčnosti naší prezentace volby.cz dál zpracování transparentně probíhalo. Jsou tam i dodatečná bezpečnostní technická opatření, například musíme nahlásit IP adresy, ze kterých budou k datům přistupovat. Je velmi těžké provést nějaký typu DoS nebo DDoS,“ doplňuje manažér kybernetické bezpečnosti statistiků Pavel Charvát.

Jeden z modelů předpovídajících výsledky voleb vytvořila česká společnost Blindspot. Hlavním autorem byl před lety Vojtěch Létal, který dnes ve Švýcarsku pracuje jako inženýr strojového učení pro přední světovou technologickou společnost.

V roce 2017, když se blížily tehdejší prezidentské volby, ho zajímalo, jak ostatní agentury pracují s predikcemi. Zjistil, že jsou velmi konzervativní a poměrně pomalu poskytují přesný výsledek. Tématu se začal věnovat ve volném času.

Jeho první model uměl nabídnout celkem přesný výsledek už při 5 až 10 % sečtených hlasů. Při uvažování o něm se inspiroval doporučovacím systémem platforem Netflix a YouTube.

autoři: Ondřej Vaňura , aka
Spustit audio

Související