Dodano: 27 maja 2019r.

Sztuczna inteligencja tworzy realistyczne wideo z jednego zdjęcia

Inżynierowie z Samsunga usprawnili sztuczną inteligencję tworzącą tzw. deepfake i wprowadzili ją na zupełnie nowy poziom. Wystarczy jedno zdjęcie, by algorytmy na jego bazie stworzyły realistyczne wideo. Autorzy zaprezentowali swoją technologię na przykładzie portretu Mona Lisy. Efekt? Mona Lisa porusza się, mówi, mruga oczami, a wszystko to wygląda niepokojąco dobrze.

Deepfake to technika tworzenia lub modyfikowania materiałów wideo z wykorzystaniem algorytmów sztucznej inteligencji. Nazwa wzięła się od połączenia słów deep learning – jedna z metod uczenia maszynowego oparta na sztucznych sieciach neuronowych – oraz fake, co w języku angielskim oznacza falsyfikat, fałsz, podróbkę. Technologia pozwala na generowanie materiałów wideo, które pokazują coś, co w rzeczywistości nie miało miejsca.

Możliwości sztucznej inteligencji w generowaniu deepfake są coraz większe i budzą też coraz większe obawy. Osiągi inżynierów Samsunga pokazują, że do stworzenia fałszywego materiału wideo wystarczy jedno zdjęcie pobrane chociażby z portalu społecznościowego. Nie trudno sobie wyobrazić, do czego może posłużyć takie narzędzie w rękach oszusta.

Ostatnie usprawnienia algorytmów sztucznej inteligencji w generowaniu treści deepfake wnosi tę technologię na zupełnie nowy poziom i jest dziełem inżynierów z laboratorium badawczego firmy Samsung w Moskwie. Nowe algorytmy mogą nie tylko działać z mniejszej początkowej bazy danych obrazów (wystarczy jeden), ale również tworzyć filmy w bardzo krótkim czasie.

„Nasza technologia będzie miała zastosowanie w wideokonferencjach czy grach wideo, ale także w branży efektów specjalnych” – napisali twórcy w artykule opublikowanym w archiwum pre-printów arXiv.org. Technologia ta będzie miała także ogromny potencjał do nadużyć.

Algorytmy Samsunga zostały przeszkolone na publicznej bazie 7000 zdjęć celebrytów. System działa w oparciu o szereg cech, którymi można manipulować – charakterystyczne rysy twarzy czy mimika. System odwzorowuje te cechy i nadaje im realistycznie wyglądające ruchy. Dzięki szkoleniu potrafi dopasować mimikę do wyglądu postaci ze zdjęcia, czego efektem jest realistyczne nagranie wideo.

Sztuczna inteligencja wygenerowała fałszywe filmy z Mona Lisą, Albertem Einsteinem, Salwadorem Dali, Fiodorem Dostojewskim czy Marilyn Monroe. Efekt można zobaczyć poniżej.

<br />

Co prawda filmy generowane na podstawie jednego zdjęcia nie są tak dobre jakościowo, jak chociażby te stworzone z wykorzystaniem kilkunastu bądź kilkudziesięciu fotografii. Ale mogą wystarczyć, by kogoś oszukać. Do tego technologia ta rozwija się w szybkim tempie, także należy się spodziewać, że wkrótce jakość znacznie się poprawi.

Źródło: Science Alert, fot. Samsung AI Center