Развитие голосовых ассистентов

Использование голосовых команд. Многие пользователи мобильных устройств предпочитают управлять своими гаджетами с помощью голоса. Это удобно и экономит время. Наблюдается стремительный рост числа таких пользователей: ожидается, что к 2020 году голосовые запросы составят более половины от общего числа запросов в интернете.

Эволюция голосового управления. С каждым годом голосовые технологии становятся всё популярнее. Около 20% владельцев смартфонов регулярно используют голосовой поиск для получения информации из сети. Эксперты предсказывают, что в ближайшем будущем большинство запросов будут осуществляться именно таким образом.

Инновации в мире голосовых помощников

Недавно компания Яндекс представила новинку — умную акустическую систему «Яндекс.Станция». Оснащенная интегрированным помощником по имени Алиса, эта колонка может функционировать как устройство для просмотра телепрограмм благодаря встроенному HDMI. Управление интерфейсом, поиском в сети и просмотром видео реализовано с помощью голосовых команд. Зарождение эры искусственного голоса. Немногие знают, что корни голосовых ассистентов уходят в далекий 1779 год. Этот период отмечен выдающимся изобретением немца, работавшего в России, инженера Христиана Кратценштайна. Он сумел сконструировать аппарат, способный издавать ряд гласных звуков. Это были зародыши механического синтеза речи, которые стали основополагающими для будущих фонетических технологий. Сегодня такое изобретение может показаться примитивным, но в те времена оно стало настоящим прорывом. К сожалению, подробности о механизме, включая его изображения и схемы, не сохранились до наших дней.

Эволюция голосовых технологий

Первопроходцем в мире синтеза речи стал электронный аппарат, созданный ученым Гомером Дадли из лаборатории Bell в 1937 году. Назывался он Voder и представлял собой революционное устройство, способное воспроизводить человеческую речь.

Зарождение голосовых интерфейсов
На демонстрации Voder, управляемый оператором через специализированную клавиатуру, подобную клавишам музыкальных инструментов, смог озвучить имя с различными интонациями, показав потенциал будущих голосовых ассистентов.

История развития распознавания речи
Изначально задача стояла не в имитации человеческого голоса техникой, а в обучении устройств пониманию устной речи. Работа в этом направлении началась с исследований советского ученого-физика Льва Мясникова, который с 1939 года занимался изучением технической фонетики. Несмотря на тяжелые времена Второй мировой войны и блокаду Ленинграда, к 1942 году Мясников успешно защитил свою научную работу. Его экспериментальное устройство способно было узнавать отдельные звуки речи, включая гласные и согласные, что стало прорывом в данной области.

Эволюция голосового распознавания

Путь к современным голосовым помощникам В далёком 1952 году Bell Laboratories представили инновацию — первый устройство, способное узнавать устную речь. Этот прототип, получивший название AUDREY, умел распознавать цифры от одного до девяти. Огромный по размерам, он достигал 1,8 метра в высоту. AUDREY требовал, чтобы говорящий был ему «знаком», и тогда точность распознавания достигала 90%. С тех пор прогресс не стоял на месте. Современные голосовые ассистенты ошибаются всего в 5% случаев, что сопоставимо с человеческой способностью воспринимать звуки.

Голосовые ассистенты: От Shoebox к современности
В 1962 году произошло значимое событие в области технологий распознавания голоса — IBM представила миру систему Shoebox. Эта разработка позволяла трансформировать произнесенные в микрофон числа в электрические сигналы, которые затем сверялись с заранее внесенными в память устройства голосовыми образцами. Таким образом, пользователь, говоря в ручной аппарат, мог взаимодействовать с компьютером, который «понимал» его речь. Этот прорыв положил начало эре голосовых помощников, которые стали неотъемлемой частью современных технологий.

Эволюция голосовых ассистентов

Изначально технологии голосового управления ограничивались распознаванием всего лишь 22 команд: базового набора слов и чисел, дополненного рядом инструкций для математических операций. Продукты того времени, предназначенные для восприятия речи, были схожи по своим функциям, что приводило к замедлению инноваций в этой области. Это вызвало снижение интереса и веры в потенциал развития голосовых технологий, приведя к периоду застоя.

История развития голосовых технологий
В 1969 году инженер Джон Пирс выразил скепсис в открытом письме касательно прогресса в сфере фонетики. Это высказывание привело к сокращению инвестиций в группу Bell, которая тогда была в авангарде исследований. В результате команда потерпела финансовые трудности на протяжении нескольких лет. Тем не менее, в 1980-х годах, несмотря на препятствия, была создана говорящая кукла Джули, заложившая основу для будущих инноваций в области голосовых помощников.

Игровые технологии как движущая сила инноваций
Игрушки часто служат толчком для прогресса, хотя взрослые могут и не придавать этому значения. В 1987 году в США стали продавать интерактивную куклу по имени Джулия, которая могла обучаться узнавать человеческую речь. Этот продукт стал примером невидимого взрослым вклада детских развлечений в развитие технологий.

Переосмысление важного научного достижения
Примерно за семь лет до того, как новая игрушка увидела свет, произошло значимое событие в научном мире, которое оказалось гораздо более важным, чем создание Джулии. В 1980-м инженерам удалось впервые успешно применить техники, основанные на трудах российского математика А.?А. Маркова, связанные с «Скрытыми Моделями Маркова». Этот метод стал настоящим прорывом в своей области.

Пн	Вт	Ср	Чт	Пт	Сб	Вс
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Инновации в мире голосовых помощников

Эволюция голосовых технологий

Эволюция голосового распознавания

Эволюция голосовых ассистентов

Появление первого смартфона

Умные часы