Немного фантастики, немного характерных для бета-стадии забавных ошибок и полное понимание того, что пока несовершенная система машинного перевода — возможность заглянуть в будущее.

Русский язык стал девятым, который поддерживает технология машинного перевода Microsoft. Облачный сервис Microsoft Translator обеспечивает и переводы в Skype, и работу одноименного мобильного приложения. Но если приложение встает и на iOS, и на Android, протестировать голосовой перевод в Skype смогут только пользователи Windows версии 7 и старше. Хорошая новость: чтобы при разговоре воспользоваться переводчиком, достаточно, чтобы система поддерживалась хотя бы у одного из участников разговора.

Моя первая в жизни беседа с искусственным интеллектом в роли переводчика прошла с директором Microsoft Research Group по продуктовой стратегии Оливером Фонтана. Я говорил по-русски, мой собеседник на неродном для себя английском. Чтобы система работала более качественно, мы воспользовались рекомендацией Microsoft исключить внешние шумы, и надели гарнитуры с микрофонами.

Skype Translator уверенно преодолел банальности, с которых обычно начинают беседу два незнакомых человека: приветствия, погода, сетования на московский трафик. Но когда разговор перешел на обсуждение глубоких нейронных сетей, переводчик начал сбоить.

«Это нормально», — уверяет мой собеседник из Microsoft. Процесс, который стартует 11 октября, — это одновременно и тестирование, и обучение системы. Технология перевода, на которой построен Microsoft Translator, не предусматривает семантический анализ речи. Облако не понимает, о чем мы говорим. Переводчик использует статистические методы. Если чаще всего такой набор слов в одном языке соответствует некоему иному в другом, система использует его в качестве перевода. При этом лучше, чтобы сами фразы были достаточно длинными. Это поможет программе отсечь лишние варианты. В случае ошибки алгоритм будет скорректирован. И так до тех пор, пока перевод не станет идеальным. Чем больше речевых примеров в запасе у Microsoft Translator, тем выше качество перевода. Примеры пополняются за счет фраз, случайно и анонимно взятых из разговоров пользователей. Носители языка анализируют качество перевода и вносят изменения в алгоритм.

Самая большая статистика набрана на английском. Пары русский-испанский, русский-немецкий и так далее пока статистически слабы. Перевод по ним идет через промежуточный английский и работает не совсем уверенно. Если язык русско-английского переводчика можно назвать уровнем ученика начальной школы, то русско-испанский — это еще детский лепет: иногда точный, иногда забавный.

Однако. Когда нужно сообщить администратору отеля в Китае, что ты задерживаешься, но все равно приедешь обсудить цену с хозяином испанских апартаментов, подтвердить аренду машины в Лионе, Skype Translator с задачей справится. Пусть не с первого раза, но с третьего наверняка. Помните коробочку-переводчик из старых фантастических фильмов? Она уже изобретена, осталось научить ее работать. Для этого с ней нужно чаще разговаривать.