Встановлено новий рекорд по точності серед систем розпізнавання мови

9 Views Comment Off

На міжнародній конференції “Interspeech”, присвяченій проблемам та технологій голосового спілкування, представники компанії Microsoft оголосили про те, що створена ними нова система розпізнавання мови продемонструвала найнижчий на сьогоднішній день рівень здійснюваних помилок.  На цьому тесті система Microsoft показала рівень помилкового розпізнавання в 6.3% WER (word error rate), змістивши з першого місця п’єдесталу пошани систему компанії IBM, точність роботи якої становить зараз 6.6% WER.

“Наше досягнення стало можливим завдяки використанню нового типу багаторівневої нейронної мережі, здатної формувати прямі зв’язки між окремими шарами” – розповідає Ксуедонг Хуанг, провідний вчений компанії Microsoft в області розпізнавання мови.

Другим компонентом, який забезпечив успіх компанії Microsoft, став набір інструментів під назвою Computational Network Toolkit. Цей набір програмних засобів дозволяє скласти оптимізовані алгоритми глибинного машинного вивчення, які виконуються на порядок швидше, ніж все інше, що було створено раніше. А ключовим моментом, який забезпечив настільки високу швидкодію алгоритмів, є можливість використання потужності паралельних обчислень на базі графічних процесорів (GPU).

Це досягнення компанії Microsoft є наочною демонстрацією рівня розвитку сучасної комп’ютерної техніки, програмного забезпечення і можливостей систем штучного інтелекту на базі нейронних мереж. Всього два десятиліття тому найкращі системи розпізнавання мови демонстрували рівень помилок в 43 відсотка. Такий показник мала система компанії IBM, створена в 1995 році, вже в 2004 році нова система компанії IBM мала рівень помилок розпізнавання слів в 15.2 відсотка. А в недалекому майбутньому системи розпізнавання мови повинні впритул наблизитися і перевершити точність розпізнавання мови людиною, яка, за оцінками деяких експертів, становить близько чотирьох відсотків.

І на завершення слід зазначити, що компанія Microsoft вже досить давно зробила штучний інтелект ключовою фігурою в технологіях голосового управління. Ці технології вже використовуються в повній мірі голосовим помічником Cortana і не за горами той день, коли ці технології займуть ключову позицію в управлінні різноманітними портативними електронними пристроями, звичайними комп’ютерами, системами “розумний будинок” і системами автомобілів.

... ... .
In : Техно

Related Articles

404