Tato tvář neexistuje. A to byl teprve začátek problému

„Fotografie je certifikát přítomnosti.“

Roland Barthes, Světlá komora

V únoru 2019 vzal inženýr Uberu jménem Phillip Wang veřejně dostupný kód od NVIDIA, spustil ho na serveru a vytvořil web s jednoduchou funkcí: při každém obnovení stránky se zobrazí fotografie člověka. Realistická, detailní, přesvědčivá fotografie. A žádný z těch lidí nikdy neexistoval.

Web se jmenuje thispersondoesnotexist.com a Wang ho vytvořil, aby upozornil veřejnost na tuto technologii. Stránka se záhy stala virálem a na několik týdnů hlavním tématem technologických médií. Lidé ji obnovovali znovu a znovu, zírali na tváře a říkali si: jak je možné, že tohle není skutečná osoba?

Tehdy to bylo překvapení. Dnes je to standard. A přesun od jednoho k druhému se odehrál rychleji, než většina lidí stihla zaregistrovat.

Jak se rodí tvář, která neexistuje?

Za tím vším stál StyleGAN – architektura neuronové sítě, kterou výzkumníci NVIDIA zveřejnili v prosinci 2018. StyleGAN funguje jako rozšíření architektury GAN, tedy generativní adversariální sítě. Princip je elegantní: dvě sítě soutěží mezi sebou. Jedna generuje obrázky, druhá se snaží odhalit, které jsou falešné. Trénink skončí tehdy, když generátor začne podvodníka klamat konzistentně – jinými slovy, když falzifikátor přestane být rozpoznatelný.

Zajímavé je, že vytváření fotografií neexistujících lidí byl původně vedlejší produkt. Hlavním cílem nebylo mást populaci, ale posunout hranice počítačové syntézy obrazu. A ukázat, že AI dovede generovat fotorealistické textury a assety, které jsou použitelné v pokročilé počítačové grafice a herním průmyslu.

Možnost kombinovat rysy různých tváří, měnit věk, pohlaví, výraz, interpolovat mezi dvěma identitami jsou funkce, které tehdy vypadaly jako hollywoodská sci-fi. Dnes jsou dostupné každému, kdo si stáhne správnou aplikaci. Curve of progress se nezastavila.

Od tváří k deepfake: Sedm let zrychlování

Staré podvody typu „nigerijský princ“ byly nahrazeny silně uvěřitelnými deepfake videi s rozpoznatelnými tvářemi. To je přesný popis toho, co se odehrálo mezi rokem 2019 a dneškem.

  Váš střevní mikrobiom je úžasný. Tyto čtyři živočichy by to nechalo chladnými

Technologie prošla několika generacemi. StyleGAN2 v roce 2020 odstranil charakteristické artefakty první verze. StyleGAN3 v roce 2021 přinesl další skok v kvalitě. Paralelně vznikaly nástroje pro video deepfake, hlasové klonování a syntézu celých scén. Dnešní modely jako Sora 2 dokáží renderovat 4K video – ne dokonale, ale dostatečně přesvědčivě na to, aby prošlo rychlým pohledem na sociálních sítích.

A to je přesně problém. Lidský zrakový systém se vyvíjí v prostředí, kde fotografická věrnost implikovala realitu. Fotografie byla po více než století certifikátem přítomnosti — jak to formuloval Roland Barthes. Tato intuitivní důvěra je teď systematicky zneužívána.

Falešné klipy osobností jako Elon Musk, Joe Biden nebo Volodymyr Zelenskyj se šíří jako virální obsah a zavádějí diváky k přesvědčení, že dotyční pronesli kontroverzní prohlášení nebo podpořili falešné nároky. A to jsou ještě relativně sofistikované případy. Na druhém konci spektra stojí AI generované hlasy a tváře využívané v podvodných schématech — od imitace hlasu CEO po falešné investiční výzvy.

Jak poznat, co je skutečné?

„Co je skutečné? Jak definuješ skutečné?“

Morfeus, Matrix

Psychologický výzkum přináší mírně znepokojivý závěr: pochopení reakcí, které deepfake tváře vyvolávají v pozorovatelích, je klíčové pro posouzení jejich společenských důsledků. Studie z Humboldtovy univerzity v Berlíně zjistila, že pouhé podezření, že tvář je AI generovaná, tlumí emocionální a hodnotící zpracování — tedy že reagujeme jinak na tváře, o kterých víme nebo si myslíme, že jsou umělé. Problém je, že toto vědomí nemáme konzistentně.

Jednou z nejspolehlivějších metod detekce jsou fyziologické signály, které AI prostě nesimuluje. AI generované tváře mívají abnormální vzorce mrkání — příliš mechanicky nebo příliš zřídka, někdy jednou za třicet až šedesát sekund. Oči postrádají sakadické pohyby — drobné rychlé přesuny, které oči dělají při skenování místnosti nebo sledování konverzace. Výsledkem je fixní, životem neprostoupený pohled.

  Tvůj úspěch. Tvoje zásluha? Simulace, která rozbila příběh meritokracie

U videí pomáhá sledovat okraje obličeje při pohybu hlavy. Většina deepfake modelů je trénována primárně na čelních záběrech. Když se syntetická tvář otočí do profilu, rendering se rozpadá — ucho se rozmaže, čelist se oddělí od krku, brýle se rozplynou do kůže.

Tato vodítka ale mají omezenou životnost. Jak se technologie zlepšuje, artefakty mizí. Závody ve zbrojení mezi generátory a detektory jsou strukturálně asymetrické: generátor musí oklamat jednou, detektor musí odhalit vždy.

Co s tím?

Zákony se vyvíjejí, aby řešily škodlivé deepfaky, zejména ty používané pro obtěžování, podvody nebo dezinformace. Některé země a americké státy již zavedly legislativu postihující konkrétní použití syntetických médií. Americký zákon Take It Down Act z roku 2025 vyžaduje, aby online platformy odstraňovaly nekonsenzuální intimní obsah — včetně AI generovaného — do 48 hodin. EU AI Act z roku 2024 klasifikuje AI systémy podle rizikovosti a ukládá přísná pravidla pro deepfaky, včetně povinného označování syntetického obsahu.

Regulace je potřebná, ale nestačí. Skutečný problém je epistemický: žijeme v prostředí, kde intuitivní důvěra ve vizuální důkazy přestává fungovat. To neznamená, že máme přestat věřit čemukoli. Znamená to, že musíme přijmout jiný standard ověřování — podobně jako jsme v 19. století museli přijmout, že tisk může lhát, a naučit se pracovat s více zdroji.

Phillip Wang vytvořil thispersondoesnotexist.com proto, aby „zvýšil povědomí veřejnosti o této technologii“. Podařilo se. Jen nečekal, jak rychle se z povědomí stane každodenní realita.

Zdroje: YouTube, Wiki, TechCabal, ESET, Eiserbeck