Новости ИИ. Microsoft translator опубликовал релиз корпуса перевода разговорной речи

aiВ рамках продолжающихся усилий в работе по повышению точности работы систем с искусственным интеллектом (ИИ), Microsoft Translator опубликовал для общего пользования набор данных, который включает в себя множество вариантов разговоров между двуязычными говорящими людьми на французском, немецком и английском языках.

Этот корпус направлен на создание стандарта, по которому люди смогут оценить, насколько хороша их разговорная речь системы перевода. Он сможет служить в качестве стандартного набора данных для тестирования систем двуязычной разговорной речи переводчика, такие как  Microsoft Translator live и Skype Translator.

Кристиан Федерманн, старший менеджер в команде Microsoft Translator, сказал, что не так много стандартизированных наборов данных для тестирования двуязычных разговорных систем речевого перевода. "Людям необходимы данные высокого качества для того, чтобы сделать высоко-качественное тестирование," сказал Федерманн.

Команда Microsoft надеется, что корпус, который находится в свободном доступе, принесет пользу всей области разговорного перевода и поспособствует созданию более стандартизированных тестов, которые исследователи могут использовать для оценки.

"Это поможет продвинуться вперед," сказал Уилл Льюис, главный технический менеджер в команде Microsoft Translator, который также работал над проектом.

Скачать корпус Microsoft Speech Language Translation здесь.

Корпус включает аудио, транскрипты и переводы.