Przejdź do treści

W chińskiej telewizji serwis informacyjny poprowadzi wygenerowany cyfrowo prezenter

Spis treści

Chińska państwowa agencja prasowa Xinhua zaprezentowała pierwszego prezentera telewizyjnego wygenerowanego przez algorytmy. To pierwszy z wielu fikcyjnych prezenterów, który w przyszłości poprowadzi serwisy informacyjne w różnych językach skierowane do różnych narodów.

Cyfrowy prezenter porusza się i zachowuje niemal jak prawdziwy człowiek. Jego ruchy i mimika jest płynna i trzeba się wysilić, by zauważyć różnice. W zaprezentowanych nagraniach prezentera zdradza głos – twórcy skorzystali z syntezatora mowy, ale to akurat można łatwo zmienić.

Pierwszy sztuczny prezenter – Artificial Intelligence News Anchor – został zaprezentowany na World Internet Conference. Xinhua pokazała dwie wersje tego samego prezentera – jedna mówi w języku angielskim, druga po chińsku. Agencja poinformowała też, że planuje wdrożyć różnie wyglądających prezenterów i prezenterki, w zależności od  przedstawianych informacji – inny będzie informował o sporcie, inny o biznesie.

Jak podaje „South China Morning Post”, prezenter został stworzony przy współpracy Agencji Informacyjnej Xinhua z wyszukiwarką Sogou.com. Twórcy skorzystali z technologii uczenia maszynowego. Algorytmy oglądały setki transmisji wideo, by nauczyć się poruszać ustami dokładnie tak, jakby mówiły. Przy okazji doskonaliły mimikę twarzy oraz ruchy całego ciała sztucznego prezentera.

W połączeniu z syntezatorem mowy, taki prezenter może pracować bez wytchnienia, nie pobiera pensji, nie chodzi na urlop i nigdy nie będzie strajkował. Ryzyko wpadki na wizji też jest minimalne i do tego w krótkim czasie algorytm może poznać każdy język i każde zagadnienie. To znacznie redukuje koszty produkcji wiadomości i zwiększa wydajność i zasięg serwisów.

Xinhua w oświadczeniu napisała, że cyfrowy prezenter ma „nieskończone perspektywy i może być używany do taniego generowania raportów dla agencji, telewizji i Internetu”.

Technologia ma jednak swoje ograniczenia. Na zaprezentowanych przez agencję nagraniach widać, że zakres mimiki twarzy jest ograniczony, a głos jest wyraźnie sztuczny. Ale algorytmy uczą się bardzo szybko i nie trudno wyobrazić sobie przyszłość, w której cyfrowi prezenterzy są nie do odróżnienia od prawdziwych.

Podobne technologie już od jakiegoś czasu są opracowywany w wielu instytutach badawczych. Za ich pomocą można stworzyć realistyczne wideo przedstawiające chociażby polityków wypowiadających słowa, których nigdy by nie wypowiedzieli. Technologia ta wzbudza sporo kontrowersji. Politycy i badacze obawiają się, że pozwoli na tworzenie nowych, wyjątkowo groźnych i realistycznych fake newsów. Więcej na ten temat w tekście: Deep Video Portraits – nowy poziom manipulacji oparty na sztucznej inteligencji.

Źródło: South China Morning Post

Udostępnij:

lub:

Podobne artykuły

Sztuczna inteligencja w debatach online jest bardziej przekonująca niż ludzie

sztuczna inteligencja

Sztuczna inteligencja określi wiek biologiczny na podstawie zdjęcia

mózg

Implant mózgu, który niemal natychmiast zamienia myśli na mowę

Wyróżnione artykuły

Popularne artykuły