Вчені навчили штучний інтелект озвучувати відеоролики з максимальною реалістичністю

215 Views Comment Off

“Автором” цих звуків може бути комп’ютер і система штучного інтелекту, яка досить “розумна” для того, щоб розібратися, що відбувається на відео і забезпечити це все відповідним звуковим супроводом. І, в деяких випадках, система робить це настільки вдало, що створюється враження максимальної реалістичності і природності звуків, іншими словами, комп’ютер проходить свого роду аудіо-варіант тесту Тюрінга.

Створюючи систему штучного інтелекту, фахівці з Лабораторії інформатики і штучного інтелекту Массачусетського технологічного інституту почали навчати його на прикладах простих дій, типу постукування паличкою по книзі.

Крім цього, програма була “нагодована” відео з природним звуковим супроводом, на яких демонструвалося листя, що шелестить під впливом вітру, гуркіт падаючих скель і багато-багато іншого. Всього через програму було пропущено понад тисячу відеороликів, в аудіо-доріжці яких були присутні біля 46 тисяч різних звуків.

“Алгоритм видобуває з відео ключову інформацію за формою представлених там об’єктів про матеріал, з якого вони виготовлені, про їх рух і т.п.” – розповідає Ендрю Оуенс (Andrew Owens), – “Все це порівнюється зі звуками з аудіо-доріжки і заноситься в базу даних”.
Після отримання набору даних в базі програма штучного інтелекту пропустила їх через алгоритм так званого глибинного вивчення. В результаті цього штучний інтелект знайшов можливість ідентифікувати об’єкти на відео і те, що відбувається з ними, плюс до цього, алгоритм прив’язав об’єкти, події та явища до конкретних звуків.

Після процесу самонавчання система штучного інтелекту стала здатною самостійно озвучувати відеоролики, які їй завантажуються і в яких була відсутня звукова доріжка. А експерти, залучені до оцінки роботи штучного інтелекту, в середньому два рази з чотирьох вибирали звукову доріжку штучного походження при проходженні аудіо-варіанту тесту Тюрінга. Але поки що штучний інтелект має властивість помилятися в деяких випадках, особливо, якщо об’єкт на відео рухається не рівномірно, а ривками, що призводить до накладання на відео не зовсім відповідного звукового супроводу.

Дослідники сподіваються, що додаткове навчання системи штучного інтелекту, проведене на базі більш складних і різноманітних відеороликів, дозволить істотно знизити кількість скоєних системою помилок. І після цього її з успіхом можна буде використовувати для “озвучування” фільмів, телепередач, театральних постановок і т.п. Ще однією сферою застосування нової системи може стати віртуальна реальність, де штучний інтелект зможе правдоподібно озвучувати все те, що відбувається у віртуальному світі.

... ... .
In : Техно

Related Articles

404