Este IA viitorul Hollywood-ului?

William Osmon

Follow

27 sept, 2019 – 9 min citește

.

Creditul foto –

Cu mari-filme globale la scară largă care adună miliarde de dolari (Avengers Endgame a făcut 2.796 miliarde USD) la box office, oricine ar avea mijloacele necesare ar încerca același lucru. Dar, având în vedere costurile de producție pentru filmele de mare succes (bugetul Avengers Endgame 356 milioane USD), doar cele mai profitabile companii își pot permite să producă astfel de succese monumentale. Dar ce s-ar întâmpla dacă mai mulți oameni cu idei creative ar avea mijloacele necesare pentru a produce filme de la Hollywood la un procent din costuri? Prin puterea Inteligenței Artificiale și un amestec de alte tehnologii și tehnici, s-ar putea să ne aflăm în pragul unei revoluții tehnologice fără precedent până în prezent.

Cum ar putea influența Inteligența Artificială calitatea unei scene?

Timpurile de producție ale filmelor de mare anvergură variază, iar nivelul de detaliu variază în funcție de prioritatea scenei, prioritatea filmului, schimbările de ultim moment și mulți alți factori. Timpul este factorul principal care face diferența între imagini digitale 4k uimitoare care arată ca scenele filmate (Avatar al lui James Cameron) și lucruri care nu arată chiar atât de bine, cum ar fi scena de luptă din Black Panther de la Marvel în care protagonistul și antagonistul intră într-o mină spre sfârșitul filmului. O inteligență artificială ar fi capabilă să compileze imagini complexe mult mai repede decât oricare dintre cei mai talentați artiști ai noștri.

Dar cum ar funcționa? Și dispunem de tehnologia necesară pentru a o realiza?

Acest articol încearcă să răspundă la aceste întrebări, discutând despre unele dintre tehnologiile de care dispunem în prezent și despre modul în care acestea pot fi folosite pentru a construi o inteligență artificială hollywoodiană.

Recunoașterea facială

Credit foto –

Utilizăm deja recunoașterea facială în fiecare zi. Inteligența artificială este deja capabilă să recunoască fețele cu destulă acuratețe. Un sistem de recunoaștere facială verifică imaginea unei persoane prin analizarea modelelor prezente pe o față. Luând aceste puncte de date și comparându-le cu un set care include modul în care fețele se mișcă în anumite contexte, cum ar fi vorbirea sau reacțiile emoționale, un computer poate atribui valori și manipula datele faciale pentru a forța un rezultat. Aceste rezultate pot fi folosite pentru a face ca o gură digitală să se miște pentru a corespunde anumitor date. Inteligența artificială ar folosi acest lucru pentru a construi cadre fixe, unul câte unul, ale feței unui personaj care se mișcă spre un anumit obiectiv, cum ar fi recitarea unui anumit șir de cuvinte. Acest lucru poate fi făcut și mai complex prin adăugarea restului unei scene, a reacțiilor la medii, a reacțiilor la alte personaje sau a circumstanțelor. Găsirea datelor pentru a antrena o astfel de inteligență artificială este probabil partea cea mai ușoară. Există o mulțime de fișiere sursă pentru acest tip de date care pot fi găsite în înregistrările de captură de mișcare. Desigur, aceasta este o explicație suprasimplificată, dar, în scopul acestei postări, nu este diavolul în aceste detalii.

Generarea și simularea lumii artificiale

Un alt punct cheie în încercarea de a găsi o IA pentru construirea unui film este generarea și simularea lumii artificiale. Un film construit în întregime de o IA ar avea loc într-o lume complet digitală. Deși s-ar putea insera imagini digitale pe care computerul le-ar putea manipula, acest lucru nu este nici pe departe la fel de mișto ca o lume construită în întregime fără influență umană. Avem deja acest tip de tehnologie și este folosită în jocurile video. Lumile generate procedural nu sunt ceva nou și există într-o formă sau alta încă din 1991, odată cu lansarea jocului Civilization al lui Sid Meyer. Tehnologia procedurală a avansat constant în cele aproape trei decenii de atunci și a atins un vârf perceptibil în No Man’s Sky din 2016, unde lumile extraterestre, flora și fauna sunt generate procedural până la două sute cincizeci și șase de galaxii separate. Dar ce înseamnă acest lucru pentru filme? Atunci când un scenariu specifică ceva de genul „o lume distopică futuristă, cu cozi de design de la începutul secolului XX”, publicul nu va primi o versiune recolorată a orașului New York, ci o lume generată procedural care își trage influența din arhitectura de la începutul secolului XX. Aceasta ar fi, cu siguranță, o schimbare binevenită. Resident Evil nu ar mai fi filmat în Toronto, ci într-un Raccoon City generat procedural. Adăugarea unor locații variate și de nerecunoscut nu poate decât să contribuie la imersiunea publicului.

Simulatoare de fizică

Credit foto – Pexels

În plus față de reacția la mediul înconjurător, creăm digital medii complet noi. Iar partea cea mai interesantă este că mediile pe care le creăm reacționează la noi aproape în același mod în care o face cel natural. Aceste medii, utilizate de obicei în jocurile video, modelează lumea reală în ceea ce privește texturile, iluminarea și fizica. Cu încă câțiva ani sau poate cu un deceniu sau doi de muncă, IA ar putea fi folosită pentru a modela comportamentele indivizilor și ale animalelor în grupuri mari pentru a construi orașe și comportamente la scară largă care să le reflecte pe cele ale noastre. Nvidia, unul dintre cei mai importanți producători de tehnologie de grafică pe calculator, și-a lansat anul trecut simulatorul PhysX în open-source. Datorită unor astfel de decizii, oricine are cunoștințele necesare poate contribui la bogăția de cunoștințe pe care o avem în prezent și pe care o extindem.

Deepfakes

Deepfakes sunt imagini și videoclipuri care utilizează viziunea computerizată și tehnologii similare pentru a suprapune fețele și sunetul pentru a produce ceva nou. Videoclipurile care folosesc aceste tehnici circulă de ceva timp pe internet. În afară de potențialele riscuri de securitate care pot apărea pe măsură ce această tehnologie se dezvoltă, rezultatele de până acum s-au dovedit a fi atât uimitoare, cât și amuzante. Există deja un precedent în ceea ce privește utilizarea tehnicilor Deepfake în filme. Este celebru faptul că Peter Cushing a fost resuscitat pentru a relua rolul lui Tarkin în Star Wars Rogue One. Și, la prima vedere, interpretarea a fost foarte convingătoare. Îmbinarea perfectă a imaginilor digitale cu fața unui interpret viu este destul de dificilă. Când a fost nevoie de o versiune mai tânără a lui Carrie Fisher pentru a o întruchipa pe Leia Organa, tot în Rogue One, artiștii au amestecat imagini ale regretatei actrițe cu Ingvild Delia în viață. Tehnicile folosite, deși remarcabile, nu sunt perfecte. Orice persoană care urmărește scena ar fi în măsură să evidențieze faptul că ceea ce vede nu este, de fapt, Carrie Fisher. Dar dacă Deepfake nu a fost realizat de un artist, ci de o mașină? Ar fi mai bine? Probabil că da. Ceea ce a văzut lumea în Rogue One a fost opera artiștilor de motion capture, dar ce s-ar întâmpla dacă nu ar mai fi nevoie de motion capture?

Algoritmii comportamentali

Sunt un alt punct cheie. Deși nu apare imediat ca o necesitate, acest tip de algoritmi ar fi necesar în orice scenă care implică un număr mare de oameni sau animale. Oamenii și animalele se comportă în moduri previzibile în grupuri mari ca răspuns la anumiți stimuli. De exemplu, dacă un film ar implica un atac extraterestru sau o hoardă de strigoi, computerul ar trebui să fie capabil să modeleze comportamentul grupului pentru a produce o scenă precisă. Prin utilizarea unor astfel de date, ar putea fi create și analizate scenarii mai masive prin extrapolarea punctelor, iar un film ar prezenta reacții umane naturale la amenințări, ceea ce ar duce la o scenă mult mai convingătoare și mai terifiantă.

Caractere digitale după chipuri de celebrități

Credit foto – Unsplash

Una dintre cele mai interesante perspective ale acestei potențiale tehnologii este posibilitatea suplimentară a unor personalități generate pe calculator pe baza celor ale celebrităților din trecut. Există multe vedete de pe scenă și de pe ecran care au trecut în neființă, dar care sunt amintite cu drag pentru talentele lor excepționale. Posibilitatea de a include aceste personalități în filmele viitoare ar putea să nu mai fie produsul magiei sau al science-fiction-ului în viitorul apropiat. Analizând modelele, mașinile ar putea să modeleze comportamentul personajelor și să reproducă un model precis. Deși acest lucru ar putea să nu fie cușer din punct de vedere etic, există deja un precedent pentru acest tip de tehnologie în filme în prezent. Desigur, acest lucru nu se limitează la învierea interpreților, dar același tip de tehnologie ar putea fi aplicat actorilor/actrițelor contemporane pentru a-și reimagina personajele ca fiind de o altă vârstă sau specie. Acest lucru ar avea avantajul suplimentar că interpreții nu ar mai fi nevoiți să poarte proteze incomode sau să se supună unor modificări corporale pentru a juca un anumit rol.

Microsoft text to image

Deși în fază incipientă, în prezent, Microsoft a dezvoltat o tehnologie care generează imagini din text. Utilizatorii pot introduce o descriere simplă, iar programul va genera o imagine pe baza acesteia. De aproape, aceasta nu este fantastic de detaliată. Deși, de la distanță, imaginea este surprinzător de precisă. Ne putem imagina cu ușurință cât de clare vor deveni aceste tipuri de imagini în viitor. Cu o versiune mai avansată a acestui program, un utilizator ar putea introduce date mult mai detaliate și ar primi în schimb o imagine asemănătoare vieții. Combinați toate aceste imagini împreună și veți avea un segment de film.

Traducerea vorbirii – Filme produse în mod natural în alte limbi

Lansările globale, cum ar fi Star Wars și filmele Marvel, folosesc echipe de actori vocali pentru a interpreta replicile personajelor, astfel încât vorbitorii de alte limbi decât engleza să poată viziona și ei filmul. Dar filmele dublate și subtitrate nu pot purta nivelul de imersiune pe care îl pot avea filmele în limba maternă, asta este evident. Oamenii sunt programați să vadă și să audă vorbirea, așa cum învață să vorbească de mici. Atunci când auzim un discurs înregistrat, ca în cazul unui film, ne așteptăm în mod natural ca ceea ce vedem (gurile actorilor) să reflecte sunetul. În filmele dublate, acest lucru nu se întâmplă. Cu toate acestea, prin combinarea tehnologiilor, am putea găsi o soluție la această problemă. Preluând elemente ale algoritmilor Deepfake și combinându-le cu servicii precum Microsoft Speech Translation, am putea crea un program care să traducă automat discursul interpreților, cu avantajul de a avea articulații ale tractului vocal apropiate de realitate, cu care să ne delectăm ochii noștri mereu critici.

Modelarea stilurilor regizorale

Atât de multe lucruri într-un film depind de regizor. Regizorul este prima linie de apărare pe care o avem între o teribilă pierdere de timp și o capodoperă artistică. Regizorii, ca și interpreții din filme, sunt și ei oameni și, ca toți oamenii, nu durează o veșnicie. Și, la fel ca actorii, fiecare regizor aduce un întreg set de date cu tehnici avansate de filmare, inovații și practici care pot fi analizate de mașini pentru a fi reproduse cu fidelitate. Cu astfel de tehnici, lumea ar putea vedea filmul Napoleon pe care Stanley Kubrick nu l-a făcut niciodată.

Filmele cu IAI ar putea fi mai precise decât filmele din „viața reală”

Credit foto – Unsplash

Unul dintre cei mai interesanți factori din acest subiect este cel al hiperrealismului. O inteligență artificială interacționează cu matematica. Ea nu are ochi, urechi sau emoții umane. Ea se ocupă cu numere și modele. Produsul acestor operațiuni este produsul acestor operații care reprezintă cele mai intrigante aspecte ale inteligenței artificiale. Filmul Interstellar a arătat publicului produsul unor algoritmi computaționali avansați care lucrează în tandem cu efectele vizuale pentru a produce o imagine uimitoare a unei găuri negre. Gaura neagră din Interstellar a fost prezentată publicului pentru prima dată în 2014. Nu am știut cum arată de fapt până în aprilie 2019. Imaginea produsă de un computer este izbitor de asemănătoare cu fotografia reală. Alimentând cu scenarii o inteligență artificială care face mișcare, s-ar putea foarte bine să vedem cu ochii noștri ce se grăbește să descopere știința avansată.

Ce înseamnă pentru educație

Beneficiile pentru educație sunt fără precedent cu acest tip de tehnologie. Filmele istorice sunt doar atât, istorice. Deși s-a lucrat din belșug la colorarea fotografiilor vechi, procesul necesită mult timp și este foarte costisitor. Imaginile spun 1000 de cuvinte, dar ce s-ar întâmpla dacă acele imagini ar putea vorbi. De exemplu, discursul lui Lincoln de la Gettysburg a fost rostit înainte de apariția tehnologiei de înregistrare și a fost pierdut în timp. Dar evenimente atât de importante din punct de vedere istoric ca acesta ar putea fi reconstruite digital cu ajutorul tehnologiilor avansate. Știm cum arăta Lincoln, cum vorbea și cum gândea prin mărturiile date de contemporanii săi. Introducând aceste informații într-un program, ar putea fi construită o nouă versiune digitală a celui de-al 16-lea președinte al Americii pentru a educa tinerii pe teme contemporane cu una dintre cele mai volatile perioade din istoria americană. Discursul de la Gettysburg este doar un mic exemplu a ceea ce ar putea fi realizat.

Concluzie

Această prezentare generală a discutat despre potențialul utilizării IA pentru a construi filme. Putem folosi Machine Learning și recunoașterea modelelor pentru a reînnoi complet filmele, televiziunea și educația. Prin combinarea unor aspecte ale tehnologiilor și tehnicilor pe care le folosim în prezent, un proces complet nou de realizare a filmelor va izbucni și va schimba pentru totdeauna lumea media. Deepfakes, recunoașterea vorbirii, procesarea limbajului și algoritmii comportamentali, toate acestea joacă un rol în viitorul filmului și al televiziunii. Viitorul este promițător, dar trebuie să lucrăm împreună pentru a ne asigura că este gestionat în mod responsabil.

Dacă niciunul dintre punctele anterioare nu v-a convins cât de importantă este această tehnologie în prezent și cât de importantă va fi foarte curând, țineți minte… Ar putea fi folosită pentru a reface sezonul 8 din Game of Thrones.

Mulțumesc pentru lectură!

Lasă un comentariu