Вообще, конечно, — это чудо, что мы с вами можем сказать что-то вслух смартфону или компьютеру, а они нас даже поймут в 9 случаев из 10. А потом еще и отреагируют. Возможно, даже адекватно.

Распознавание голоса с помощью систем Google и Apple

Помню, как с десяток лет назад устанавливал на компьютер программу «Горыныч» в попытках повелевать своим первым Пентиумом и Windows 98. Ничего не вышло, конечно. Микрофон Genius был сделан из старого бабушкиного кресла, а «Горыныч» понимал из моих слов не больше, чем я пойму из лекции по молекулярной биологии. Естественное общение с компьютером тогда казалось весьма утопической штукой, но разработчики верили в свои силы явно больше, чем я в них, поэтому сейчас у нас уже есть Siri и Google Now. Эти ребята могут подсказать, брать ли с собой зонтик, показать картинки по запросу, проложить маршрут и черт-те сколько всего еще, на что у меня без них ушла бы уйма времени. Вот-вот с ними уже можно будет начать вести пьяные беседы, если никого из друзей не удалось заарканить к себе в гости. Но пока эти системы распознавания голоса все же не так хороши, как хотелось бы: жаргон не понимают и знаки препинания сами не расставляют. С тем же успехом можно попросить записывать под диктовку текст шестилетнего Вовочку из 1Б.

В общем, мы решили провести соревнование. Первоклашки под рукой не нашлось, но столкнуть лбами творения Google и Apple — это мы легко! Вот хитрый текст с кучей знаков препинания, датами и прочими непростыми местами.

Исходный текст, который пытались распознавать системы Google и Apple

А вот, что удалось распознать Google Now и Siri. (Хотя это на самом деле не голосовые ассистенты, а просто системы распознавания устной речи, для простоты будем назвать их именно так.)

 
Попытка системы Google распознать непростой текст
 Попытка системы Apple распознать непростой текст

Диктовалось это буквально следующим образом: «Значит так запятая дорогие Google Now и Siri восклицательный знак сейчас мы запятая...»

Выводы следующие. Хотя в целом распознавание слов у обеих систем примерно на одном уровне (в смысле общий процент ошибок), Apple как всегда уделила внимание деталям, а Google — нет. И Siri, и Google Now могут поставить запятую, точку, вопросительный и восклицательный знаки, но когда дело доходит до чего-то посложнее типа точки с запятой или многоточия, Google Now пасует, а Siri продолжает исправно набирать знаки. И даже кавычки ей под силу. Правда о том, что в русском и анлийском языках они разные, голосовой ассистент Apple не в курсе. Еще в Apple научили Siri, что писать имена собственные стоит с большой буквы — это тоже очень важно.

Но если вы думаете, что Google Now совсем нечем похвастаться, это вы зря. Если Siri будет слушать вас не более 40 секунд, то время диктовки Google ничем не ограничено. Со временем, правда, ассистент перестанет за вами поспевать, и когда вы замолчите, система еще какое-то время будет расшифровывать сказанное из буфера. И еще в Android есть возможность установить оффлайновый голосовой пакет, который позволит распознавать голос и без подключения к Сети, а вот в iOS такого нет.

Ну и просто ради фана мы решили вспомнить игру, в которую играли во дворе, когда про смартфоны еще никто даже не знал — испорченный телефон. Можете и сами от души повеселиться, для этого достаточно сказать телефону фразу позаковыристее, а потом — то, что он нарасшифровывает. И так раз десять.

Вот, во что превращается фраза «Бенедикт Камбербетч утащил СВЧ-печь».

 
Игра в испорченный телефон с Google Now
 

P.S. Оказывается, чтобы перенести курсор на новую строку в обеих системах, достаточно сказать «Новая строка». Но откуда об этом должен узнать рядовой пользователь? Хороший вопрос.