Je umělá inteligence budoucností Hollywoodu?

William Osmon

Sledovat

27. září, 2019 – 9 minut čtení

Fotografický kredit –

S velkým-globální filmy vydělávají miliardy (Avengers Endgame vydělali 2.796 miliard USD) v pokladnách kin, každý, kdo na to má, by se pokusil o totéž. Ale vzhledem k nákladům na výrobu filmových trháků (rozpočet Avengers Endgame 356 milionů USD) si produkci takových monumentálních úspěchů mohou dovolit jen ty nejvýdělečnější společnosti. Ale co kdyby více lidí s kreativními nápady mělo prostředky na produkci hollywoodských filmů za procento nákladů? Díky síle umělé inteligence a kombinaci dalších technologií a technik jsme možná právě na pokraji technologické revoluce, která nemá obdoby.

Jak by umělá inteligence mohla ovlivnit kvalitu scény?

Produkční doba velkofilmů se liší a úroveň detailů se liší kvůli prioritě scény, prioritě filmu, změnám na poslední chvíli a mnoha dalším faktorům. Čas je hlavním faktorem rozdílu mezi úžasnými digitálními snímky v rozlišení 4k, které vypadají jako natočené scény (Avatar Jamese Camerona), a věcmi, které nevypadají tak skvěle, jako například bojová scéna ve filmu Black Panther od Marvelu, kde hlavní hrdina a protivník ke konci filmu najedou do dolu. Umělá inteligence by dokázala složité obrazy sestavit mnohem rychleji než kterýkoli z našich nejtalentovanějších umělců.

Ale jak by to fungovalo? A máme technologii, která by to umožnila?“

Tento článek se pokouší odpovědět na tyto otázky tím, že se zabývá některými technologiemi, které máme v současnosti k dispozici, a tím, jak je lze využít k vytvoření hollywoodské umělé inteligence.

Rozpoznávání obličeje

Kreditní fotografie –

Rozpoznávání obličeje již používáme denně. Umělá inteligence již dokáže rozpoznávat obličeje poměrně přesně. Systém rozpoznávání obličeje ověřuje podobu osoby analýzou vzorů přítomných na obličeji. Vezme-li tyto datové body a porovná je se souborem, který zahrnuje, jak se obličeje pohybují v určitém kontextu, jako je řeč nebo emocionální reakce, může počítač přiřadit hodnoty a manipulovat s údaji o obličeji, aby si vynutil výsledek. Tyto výsledky lze použít k tomu, aby se digitální ústa pohybovala tak, aby odpovídala určitým údajům. Umělá inteligence by je použila ke konstrukci statických snímků, na nichž by se tvář postavy postupně pohybovala směrem k určitému cíli, například k odříkání daného řetězce řeči. To lze ještě více zkomplikovat přidáním zbytku scény, reakcí na prostředí, reakcí na jiné postavy nebo okolnosti. Najít data pro trénink takové umělé inteligence je pravděpodobně ta nejjednodušší část. Existuje spousta zdrojových souborů pro tento druh dat, které lze nalézt v záběrech motion capture. To je samozřejmě příliš zjednodušené vysvětlení, ale v rámci tohoto příspěvku se v těchto detailech žádný ďábel neskrývá.

Generování a simulace umělého světa

Dalším klíčovým bodem při hledání umělé inteligence pro tvorbu filmů je generování a simulace umělého světa. Film vytvořený výhradně umělou inteligencí by se odehrával v plně digitálním světě. I když by bylo možné vložit digitální záběry, s nimiž by počítač mohl manipulovat, není to zdaleka tak skvělé jako svět vybudovaný zcela bez lidského vlivu. Tento typ technologie již máme a používá se ve videohrách. Procedurálně generované světy nejsou ničím novým a v určité podobě existují již od roku 1991, kdy vyšla hra Civilization od Sida Meyera. Procedurální technologie se za téměř tři desetiletí od té doby neustále vyvíjela a dosáhla znatelného vrcholu ve hře No Man’s Sky z roku 2016, kde jsou procedurálně generovány mimozemské světy, flóra a fauna až ve dvě stě padesáti šesti samostatných galaxiích. Co to však znamená pro filmy? Když je ve scénáři uvedeno něco jako „futuristický dystopický svět s designovými liniemi z počátku 20. století“, diváci nedostanou přebarvenou verzi New Yorku, ale procedurálně generovaný svět, který čerpá vliv z architektury počátku 20. století. To by byla jistě vítaná změna. Už by se Resident Evil nenatáčel v Torontu, ale v procedurálně generovaném Raccoon City. Přidání různorodých a nepoznatelných lokací může divákům jen přidat na imerzi.

Fyzikální simulátory

Foto: Pexels

Kromě reakcí na prostředí vytváříme digitálně zcela nová prostředí. A nejzajímavější na tom je, že prostředí, které vytváříme, na nás reaguje téměř stejně jako to naše přirozené. Tato prostředí, obvykle používaná ve videohrách, modelují skutečný svět z hlediska textur, osvětlení a fyziky. Za několik dalších let nebo možná za jedno či dvě desetiletí práce by umělá inteligence mohla být použita k modelování chování jednotlivců a zvířat ve velkých skupinách, aby se vytvořila města a chování ve velkém měřítku, které by odráželo naše vlastní chování. Společnost Nvidia, jeden z předních výrobců technologií počítačové grafiky, loni uvolnila svůj simulátor PhysX jako open-source. Díky rozhodnutím, jako je toto, může každý, kdo má know-how, přispět k bohatým znalostem, které v současné době máme a které rozšiřujeme.

Deepfakes

Deepfakes jsou obrázky a videa, které pomocí počítačového vidění a podobných technologií překrývají obličeje a zvuk a vytvářejí něco nového. Videa využívající tyto techniky již nějakou dobu kolují po internetu. Kromě možných bezpečnostních rizik, která se mohou s rozvojem této technologie objevit, se dosavadní výsledky ukázaly jako překvapivé a zábavné. Použití techniky Deepfake ve filmu už má svůj precedens. Slavně byl vzkříšen Peter Cushing, aby si zopakoval roli Tarkina ve filmu Star Wars Rogue One. A na první pohled byl jeho výkon velmi přesvědčivý. Dokonalé prolnutí digitálního obrazu s tváří živého herce je poměrně obtížné. Když bylo potřeba vytvořit mladší verzi Carrie Fisherové pro ztvárnění Leiy Organy, rovněž ve filmu Rogue One, umělci prolínali obrazy zesnulé herečky s živou Ingvild Deliovou. Použité techniky, ačkoli jsou pozoruhodné, nejsou dokonalé. Každý, kdo by scénu sledoval, by byl schopen poukázat na to, že to, co vidí, ve skutečnosti není Carrie Fisherová. Ale co když Deepfake neprovedl umělec, ale stroj? Bylo by to lepší? Pravděpodobně ano. To, co svět viděl ve filmu Rogue One, bylo dílem motion capture umělců, ale co kdyby motion capture už nebyl potřeba?“

Dalším klíčovým bodem jsou behaviorální algoritmy

. Ačkoli to není na první pohled patrné jako nutnost, tyto druhy algoritmů by byly potřeba v každé scéně zahrnující velké množství lidí nebo zvířat. Lidé a zvířata se ve velkých skupinách chovají v reakci na určité podněty předvídatelným způsobem. Pokud by například film zahrnoval útok mimozemšťanů nebo hordu nemrtvých, počítač by musel být schopen modelovat chování skupiny, aby vytvořil přesnou scénu. Při použití takových dat by bylo možné extrapolací bodů vytvořit a analyzovat masivnější scénáře a film by sportoval přirozené lidské reakce na hrozby, což by vedlo k mnohem přesvědčivější a děsivější scéně.

Digitální postavy z podobizen slavných osobností

Foto: Unsplash

Jednou z nejzajímavějších vyhlídek této potenciální technologie je další možnost počítačem generovaných osobností na základě osobností slavných osobností minulosti. Existuje mnoho hvězd divadelního jeviště a filmového plátna, které již odešly, ale na které se s láskou vzpomíná pro jejich výjimečný talent. Možnost zahrnout tyto osobnosti do budoucích filmů nemusí být v blízké budoucnosti produktem magie nebo science fiction. Při analýze vzorů by stroje mohly modelovat chování postav a reprodukovat přesný model. Ačkoli to nemusí být eticky košer, již nyní existuje precedens pro tento typ technologie ve filmech. Samozřejmě se to neomezuje pouze na oživování účinkujících, ale stejný typ technologie by mohl být aplikován na současné herce/herečky, aby si znovu představili své postavy v jiném věku nebo druhu. To by mělo další výhodu v tom, že by účinkující nemuseli nosit nepohodlné protézy nebo podstupovat tělesné změny, aby mohli hrát určitou roli.

Microsoft text to image

Ačkoli je v současné době v plenkách, Microsoft vyvinul technologii, která generuje obrázky z textu. Uživatelé mohou zadat jednoduchý popis a program na jeho základě vygeneruje obrázek. Zblízka není nijak fantasticky detailní. Z dálky je však obraz překvapivě přesný. Lze si snadno představit, jak jasné budou tyto typy obrázků v budoucnu. V pokročilejší verzi by uživatel mohl zadat mnohem podrobnější údaje a na oplátku obdržet realistický obraz. Zkombinujte všechny tyto obrazy dohromady a získáte segment filmu.

Překlad řeči – filmy produkované přirozeně v jiných jazycích

Globální verze, jako jsou Hvězdné války a filmy od Marvelu, využívají týmy hlasových herců, kteří přednášejí repliky postav, aby se na film mohli dívat i uživatelé jiných jazyků než angličtiny. Je však zřejmé, že dabované a dabované filmy nemohou nést takovou míru pohlcení jako filmy v rodném jazyce. Lidé jsou uzpůsobeni k tomu, aby řeč viděli i slyšeli, je to součást toho, jak se v dětství učíme mluvit. Když slyšíme nahranou řeč, například ve filmu, přirozeně očekáváme, že to, co vidíme (ústa herců), bude odrážet zvuk. U dabovaných filmů tomu tak není. V kombinaci technologií však můžeme najít řešení tohoto problému. Převzetím prvků algoritmů Deepfake a jejich smícháním se službami, jako je překlad řeči společnosti Microsoft, můžeme být schopni vytvořit program, který automaticky překládá řeč interpretů s bonusem v podobě téměř reálné artikulace hlasivek, na které se můžeme kochat svým stále kritickým pohledem.

Modelování režisérských stylů

Ve filmu toho tolik závisí na režisérovi. Režisér je první obrannou linií, kterou máme mezi příšernou ztrátou času a uměleckým mistrovským dílem. Režiséři, stejně jako účinkující ve filmech, jsou také lidé a jako všichni lidé netrvají věčně. A stejně jako herci, i každý režisér přináší celý soubor pokročilých filmových technik, inovací a postupů, které mohou být analyzovány stroji, aby byly věrně reprodukovány. Díky takovým technikám by svět mohl vidět film Napoleon, který Stanley Kubrick nikdy nenatočil.

Filmy AI mohou být přesnější než „reálné“ filmy

Foto: Unsplash

Jedním z nejzajímavějších faktorů tohoto tématu je hyperrealismus. Umělá inteligence interaguje s matematikou. Nemá lidské oči, uši ani emoce. Zabývá se čísly a vzorci. Právě produkt těchto operací je nejzajímavějším aspektem umělé inteligence. Film Interstellar ukázal divákům produkt pokročilých výpočetních algoritmů, které pracují ve spojení s vizuálními efekty a vytvářejí ohromující obraz černé díry. Černá díra ve filmu Interstellar byla divákům poprvé představena v roce 2014. Jak ve skutečnosti vypadá, jsme se dozvěděli až v dubnu 2019. Obraz vytvořený počítačem se nápadně podobá skutečnému snímku. Díky zadávání scénářů do umělé inteligence, která se pohybuje, možná právě uvidíme na vlastní oči to, co pokročilá věda spěchá objevit.

Co to znamená pro vzdělávání

Bohacení pro vzdělávání je u tohoto typu technologie bezprecedentní. Historické filmy jsou právě jen historické. Přestože bylo vykonáno mnoho práce při kolorování starých fotografií, je tento proces velmi časově náročný a drahý. Obrázky sice řeknou 1000 slov, ale co kdyby tyto obrázky mohly mluvit. Například Lincolnův Gettysburský projev byl pronesen před nástupem záznamové techniky a byl ztracen v čase. Ale události tak historicky významné, jako je tato, by mohly být digitálně rekonstruovány pomocí pokročilých technologií. Díky svědectvím současníků víme, jak Lincoln vypadal, jak mluvil a jak přemýšlel. Vložením těchto informací do programu by mohla být vytvořena nová digitální verze 16. amerického prezidenta, která by vzdělávala mládež v tématech současných pro jedno z nejvlivnějších období amerických dějin. Gettysburgský projev je jen malým příkladem toho, čeho by bylo možné dosáhnout.

Závěr

Tento přehled pojednával o možnostech využití umělé inteligence při konstrukci filmů. Pomocí strojového učení a rozpoznávání vzorů můžeme zcela přepracovat filmy, televizi i vzdělávání. Kombinací aspektů technologií a technik, které v současnosti používáme, vypukne zcela nový proces tvorby filmů, který navždy změní svět médií. Deepfakes, rozpoznávání řeči, zpracování jazyka a behaviorální algoritmy – to vše hraje v budoucnosti filmu a tv roli. Budoucnost je slibná, ale musíme spolupracovat, abychom zajistili, že se s ní bude zacházet zodpovědně.

Pokud vás některý z předchozích bodů nepřesvědčil o tom, jak důležitá tato technologie nyní je a brzy bude, mějte na paměti… Mohla by být použita k remaku 8. série Hry o trůny.

Díky za přečtení!

Napsat komentář