Dodano: 09 listopad 2018r.

W chińskiej telewizji serwis informacyjny poprowadzi wygenerowany cyfrowo prezenter

Chińska państwowa agencja prasowa Xinhua zaprezentowała pierwszego prezentera telewizyjnego wygenerowanego przez algorytmy. To pierwszy z wielu fikcyjnych prezenterów, który w przyszłości poprowadzi serwisy informacyjne w różnych językach skierowane do różnych narodów.

 

Cyfrowy prezenter porusza się i zachowuje niemal jak prawdziwy człowiek. Jego ruchy i mimika jest płynna i trzeba się wysilić, by zauważyć różnice. W zaprezentowanych nagraniach prezentera zdradza głos – twórcy skorzystali z syntezatora mowy, ale to akurat można łatwo zmienić.

Pierwszy sztuczny prezenter – Artificial Intelligence News Anchor – został zaprezentowany na World Internet Conference. Xinhua pokazała dwie wersje tego samego prezentera – jedna mówi w języku angielskim, druga po chińsku. Agencja poinformowała też, że planuje wdrożyć różnie wyglądających prezenterów i prezenterki, w zależności od  przedstawianych informacji – inny będzie informował o sporcie, inny o biznesie.

 

Jak podaje „South China Morning Post”, prezenter został stworzony przy współpracy Agencji Informacyjnej Xinhua z wyszukiwarką Sogou.com. Twórcy skorzystali z technologii uczenia maszynowego. Algorytmy oglądały setki transmisji wideo, by nauczyć się poruszać ustami dokładnie tak, jakby mówiły. Przy okazji doskonaliły mimikę twarzy oraz ruchy całego ciała sztucznego prezentera.

W połączeniu z syntezatorem mowy, taki prezenter może pracować bez wytchnienia, nie pobiera pensji, nie chodzi na urlop i nigdy nie będzie strajkował. Ryzyko wpadki na wizji też jest minimalne i do tego w krótkim czasie algorytm może poznać każdy język i każde zagadnienie. To znacznie redukuje koszty produkcji wiadomości i zwiększa wydajność i zasięg serwisów.

Xinhua w oświadczeniu napisała, że cyfrowy prezenter ma „nieskończone perspektywy i może być używany do taniego generowania raportów dla agencji, telewizji i Internetu”.

Technologia ma jednak swoje ograniczenia. Na zaprezentowanych przez agencję nagraniach widać, że zakres mimiki twarzy jest ograniczony, a głos jest wyraźnie sztuczny. Ale algorytmy uczą się bardzo szybko i nie trudno wyobrazić sobie przyszłość, w której cyfrowi prezenterzy są nie do odróżnienia od prawdziwych.

Podobne technologie już od jakiegoś czasu są opracowywany w wielu instytutach badawczych. Za ich pomocą można stworzyć realistyczne wideo przedstawiające chociażby polityków wypowiadających słowa, których nigdy by nie wypowiedzieli. Technologia ta wzbudza sporo kontrowersji. Politycy i badacze obawiają się, że pozwoli na tworzenie nowych, wyjątkowo groźnych i realistycznych fake newsów. Więcej na ten temat w tekście: Deep Video Portraits - nowy poziom manipulacji oparty na sztucznej inteligencji.

 

Źródło: South China Morning Post