1 ≫
-
Система голосового управления обеспечивает управления некоторыми функциями автомобиля с помощью голосовых команд, которые преобразуются в управляющие сигналы и передаются соответствующим системам автомобиля. Система позволяет водителю не отвлекаться от непосредственного управления автомобилем, чем достигается комфорт и безопасность движения.
Ряд систем голосового управления имеют собственные названия: Ford Sync, Cadillac User Experience, Linguatronic от Mercedes-Benz. Систему голосового управления используют на своих автомобилях Audi, BMW, Kia, Lexus. Системы голосового управления различаются по количеству поддерживаемых языков, уровню распознавания команд, числу реализуемых функций управления.
Наибольшее количество языков (девятнадцать) в настоящее время «знает» система Ford Sync. Есть в арсенале и русский язык, а также разновидности английского и французского языков.
Системы голосового управления существенно различаются по уровню распознавания команд. Уходят в прошлое системы, в которых голосовые команды для лучшего распознавания проговариваются по буквам, что очень неудобно при использовании. Современные системы голосового управления успешно справляются с разговорным языком, различными диалектами, альтернативными формулировками, индивидуальными особенностями произношения и быстротой речи. Для повышения качества распознавания команд используется фильтр шумов, отсекающий ненужные звуки.
Стандартными функциями, реализуемыми с помощью системы голосового управления, являются управление телефоном, мультимедийной системой, навигационной системой, системой климат-контроля.
Голосовое управление телефоном обеспечивает доступ к списку контактов (телефонной книге) по имени абонента или номеру телефона, ввод голосом текстовых (SMS) сообщений для отправки, воспроизведение текстовых сообщений. Для реализации этих функций мобильный телефон должен быть синхронизирован с мультимедийной системой по каналу Bluetooth или с помощью USB-кабеля.
Еще больше возможностей предлагается владельцам телефонов iPhone. Для них компания Apple разработала систему голосового управления Siri Eyes Free. Система позволяет с помощью голосовых команд пользоваться различными приложениями iPhone: совершать звонки, прослушивать, записывать и отправлять сообщения, задавать маршрут встроенной навигационной системы, проигрывать музыкальные композиции из медиатеки, получать информацию о погоде, спорте, текущих событиях.
Голосовое управление мультимедийной системой отличается большим разнообразием реализуемых функций: перемещение по структуре основного меню, прослушивание музыкальных коллекций по жанрам, альбомам, исполнителям, вызов радиостанции радиоприемника, управление CD-проигрывателем, TV-тюнером.
После ввода голосовой команды система подает специальный сигнал, подтверждающий ее успешное понимание. В ряде систем голосового управления реализована обратная связь, имитирующая естественный диалог с пользователем.
Конструктивно система голосового управления объединяет аппаратные и программные средства. Аппаратные средства представлены микрофоном, воспринимающим голосовые команды и отфильтровывающим шум, и кнопкой запуска системы на многофункциональном рулевом колесе. Микрофон встроен во внутреннее зеркало заднего вида.
Распознавание голоса является встроенной функцией современных операционных систем, таких как Windows, iOS. Автопроизводители разрабатывают системы голосового управления на основе данных операционных систем или собственных программных продуктов распознавания речи.
Источники: http://systemsauto.ru/another/voice-control-system.html
2 ≫
-
Голосовое управление не новшество в современных автомобилях, но все чаще и чаще встречается, так как набирает популярности среди покупателей. У каждого производителя есть подобная технология, и называет её каждый по-своему.
Первым и главным назначением системы голосового управления является работа с функциями автомобиля при помощи голосовых команд. Они преобразуются с голоса в функции управления и передаются на соответствующие системы автомобиля. Такая система помогает водителю не отвлекаться от управления автомобилем. Как результат увеличивается комфорт и безопасность во время езды.
Наверное, первое, чем отличаются, это по уровню распознавания команд. Системы голосового управления, которым нужно было проговаривать команды управления по буквам отходят в прошлое, они жутко не удобные в использовании и часто допускались ошибки в обработке команд.
По стандарту система голосового управления может управлять мобильным телефоном, системой мультимедиа, системой навигации или же климат-контролем. Это еще не полный список функций, которыми могут управлять современные системы голосового управления. В некоторых автомобилях можно завести или остановить двигатель, закрыть или открыть панорамную крышу.
Во многих странах существует закон, который запрещает говорить по мобильному телефону или пользоваться им во время движения. Такая функция обеспечит водителю доступ к списку контактов на телефоне, по номеру или имени абонента. С помощью голоса можно набрать SMS для отправки или же обратно прочитать новые SMS. Для этого мобильный телефон должен быть подключен к мультимедийной системе через Bluetooth или через USB-кабель.
Больше толку от системы будет, если вы владелец IPhone. Для вас будет доступна система голосового управления Siri Eyes Free, разработанная компанией Apple. Посылая голосовые команды, вы можете управлять различными приложениями на смартфоне, набирать номера, прослушивать смс. Прокладывать маршрут в системе навигации смартфона, включать и листать музыку, а так же другими функциями смартфона.
В отличии от предыдущего варианта, в наличии такого вида системы можно отметить большой список функций. Это и управление меню мультимедиа, прослушивания различной музыки с учетом сортировки, выбор радиостанции приемника, поиск ТВ-каналов, и управление CD-дисками проигрывателя.
Как правило, конструкция системы голосового управления объединяет в себе аппаратную и программную часть. К аппаратной части относится микрофон (обязательный в любой системе), он будет воспринимать голосовые команды и фильтровать шум. Как правило микрофон встроен в переднюю часть центрального зеркала заднего вида. Кнопка запуска системы на панели или рулевом колесе так же является обязательной. Главным будет блок управления, который принимает и обрабатывает команды, а далее передает сигналы на разные исполнительные устройства подобно мультимедийной системе, блок управления двигателем и другие системы.
Источники: http://fastmb.ru/auto_shem/1423-sistema-golosovogo-upravleniya.html
3 ≫
-
С каждым днём появляются возможности усовершенствовать мир новыми технологиями и системами, делая жизнь более комфортной и удобной. Рассматривая повседневное исполнение транспортных средств, нельзя не отметить, что это далеко не современная техника, сложная в управлении, требующая дополнительных усилий и внимания. Автомобили, в которых основные бортовые функции управляются вручную и при этом отсутствует «умная» электроника, хотели бы упростить управление до подачи голосовых команд.
Распознавание команд голосом является актуальным вопросом передовых технологий. Несмотря на то, что современная наука достигла вершин прогресса, всё же в повседневной жизни очень трудно встретить транспортное средство, оснащенное системой распознавания голоса и управления с его помощью бортовыми командами. Передовые авто/концерны мира, такие как Ford, BMW, Mercedes, стремятся повысить безопасность и комфорт водителя, поэтому дают возможность управлять бортовой электроникой при помощи голоса («включи радио, включи следующую станцию, позвонить, номер»).
Разработка системы, позволяющей не отводить взгляд от дороги и не занимать руки водителя лишними манипуляциями. Голос является идеальным решением для управления бортовыми функциями. Отсутствие различных кнопок и необходимости их нажимать существенно снижает риск опасности отвлечь водителя во время управления автомобилем.
Голосовое управление имеет большие перспективы на автомобильном транспорте, однако ни отечественные, ни зарубежные автомобили не могут ощутить «силу слова».
В связи с этим разработана компьютерная система голосового управления и контроля за бортовыми функциями автомобиля. Данная система сможет быть интегрирована в обычный автомобиль и при этом обеспечивать как и удобство во время езды, так и безопасность работы автомобиля.
Сегодня существуют два основных вида технологий распознавания голоса. Один из них - это распознавание речи, зависящее от диктора, т.е. пользователь должен сначала научить систему распознавать его голос, и только после этого система может функционировать. Второй - это распознавание речи, не зависящее от диктора, т. е. система способна распознать любую речь, независимо от того, кто говорит. Системы распознавания речи, зависящие от диктора (голосозависимые), предназначены для одного конкретного пользователя. Другие способы распознания, голосоне- зависимые системы разрабатываются для любого пользователя конкретного типа (например, американский английский). Это самые сложные в разработке и самые дорогие системы, а точность распознавания у них ниже. Однако эти системы более гибки. Адаптивные системы приспосабливаются к характеристикам нового диктора. Уровень их сложности лежит где-то посередине между голосонезависимыми и голосозависимыми системами. Системы распознавания изолированных слов работают с дискретными словами - в этом случае требуется пауза между словами. Это самая простая форма распознавания, так как в этом случае легко определяется конец речевого сигнала, а произношение слова не затрагивает другие слова. Поскольку в этих системах количество слов постоянно, то их легче проектировать. Системы распознавания непрерывного речевого сигнала работают с речевым потоком, в котором слова сливаются, т.е. не разделены паузой. Непрерывную речь обрабатывать гораздо сложней по целому ряду причин, во-первых, трудно определить начало и конец слова. Вторая проблема - это коартикуляция. На звучание каждой фонемы влияет звучание соседних фонем, а на начало и конец слов влияют предыдущие и последующие слова. Распознавание непрерывной речи зависит также от скорости речи: с быстрой речью работать сложнее, чем с медленной.
Размер словаря системы распознавания голоса влияет на степень сложности, требования к процедурам обработки и точность системы. Одним системам для работы необходимо всего несколько слов (например, только числа), а другие работают с очень большими словарями (например, диктофонные машины). Четких градаций объемов словарей нет. Но обычно словари классифицируются на:
- маленькие словари - это десятки слов;
- средние - сотни слов;
- большие словари - тысячи слов;
- очень большие словари - это десятки тысяч слов.
Есть еще две проблемы, тесно связанные с объемом словарей. Одна из них касается разработки и обеспечения доступа к специальным базам данных (словарям): необходимо обеспечить ведение такой базы и возможность обновления данных для специальных групп пользователей различных профессий, например в медицинской или правовой сфере. Вторая проблема - это проверка грамматики. Ведь программы разрабатываются не только для записи продиктованных слов, но и включают функции проверки и исправления структур предложений.
Из вышесказанного следует, что системы распознавания голоса требуют огромных ресурсов, включая вычислительную мощность, память и сетевые возможности. С распознаванием голоса тесно связаны две технологии:
- цифровая обработка сигнала;
Методы цифровой обработки сигнала обычно осуществляют преобразование, очистку и трансформацию акустического сигнала в цифровой формат данных и другие представления, которые могут непосредственно обрабатываться системой распознавания речи. Эти задачи включают фильтрацию шумовых сигналов, которые примешиваются к звуку при передаче акустических сигналов от воспринимающих устройств (микрофонов) или по сети. Методы распознавания образов используются при выделении и распознавании отдельных слов или предложений речевого потока или в некоторых случаях для идентификации говорящего. Кроме этого, понадобится лингвистическая теория - в ней заложены фундаментальные концепции и принципы распознавания речи и понимания языка.
Процесс распознавания голоса проходит в несколько этапов. На каждом из этапов для обработки речевого сигнала используется целый ряд различных методов. Процесс распознавания голоса можно разбить на три этапа:
- получение голосового сигнала и предварительная обработка речи;
- распознавание фонем и слов;
«Понять» речь - это самое трудное. На этом этапе последовательности слов (предложения) должны быть преобразованы в представления о том, что хотел сказать говоривший. Хорошо известно, что понимание речи опирается на огромный объем лингвистических и культурных знаний. Большая часть систем распознавания голоса учитывает при этом знания о естественном языке и конкретные обстоятельства. Задача, связанная с распознаванием голоса, - распознавание говорящего, т.е. процесс автоматического определения, «кто говорит» на основе входящей в речевой сигнал индивидуальной информации. При этом речь может идти об идентификации или о верификации говорящего. Идентификация - это нахождение в известном множестве контрольных фраз экземпляра, соответствующего манере данного диктора говорить. Верификация диктора - это определение идентичности говорящего: тот ли это человек? Технология распознавания диктора позволяет использовать голос для обеспечения контроля доступа; например, телефонный доступ к банковским услугам, к базам данных, к системам электронной коммерции или голосовой почте, а также доступ к секретному оборудованию. Обе технологии требуют, чтобы пользователь был «занесен в систему», т.е. он должен оставить образец речи, по которому система может построить шаблон. В процессе разработки предпринимались попытки создать и аппаратную реализацию систем распознавания голоса, но такие системы не показали высоких результатов. Чип поддерживает голосозависимое распознавание на базе словаря, хранимого в постоянном запоминающем устройстве чипа (ROM, read only memory). Словари го- лосозависимых систем хранятся вне чипа и могут быть загружены во время работы системы.
Для распознавания бортовых команд в автомобиле достаточно сложным является подавление окружающего шума работы двигателя, внешних звуков дороги и разговора пассажиров. Для этого предложено снимать звук не с общего микрофона, а с микрофонной гарнитуры, которая обеспечивает наиболее близкий контакт к голосовым связкам человека.
Система, кроме управления основными командами, должна работать и как «умная» электроника. Гибкость программного обеспечения позволяет настроить работу всех функциональных приборов логически. К примеру, самая простая защита от запуска стартера во время того, как двигатель уже работает. При прокрутке стартером включенного мотора изнашиваются шестерни, что в дальнейшем может нарушить запуск машины автомобиля. Данная система будет блокировать ошибочное действие человека и не запустит стартер, чем продлит ему срок службы. Естественно, что компьютерная система не смогла бы работать и анализировать происходящие процессы без дополнительных встроенных датчиков, которые являются «нервными окончаниями» всей системы.
Для водителя, который впервые сел за руль автомобиля, будет включен обучающий курс работы с данной системой, в ходе которого ему представится обучить компьютерную программу на распознавание его личного голоса.
Использование компьютера на бору автомобиля позволяет расширить функциональность системы дополнительными опциями. Замена зеркала заднего вида на инфракрасную камеру ночного видения, которая передает изображение на монитор. В систему заложено голосовое управление аудиосистемой (поиск музыки, регулирование громкости и т.п.). А также замена классической системы зажигания на микропроцессорную, роль блока управления которой также возложена на компьютер. Такая система обеспечивает стабильную работу двигателя и снижает расход топлива.
Продолжается модернизация и исправление неточности работы системы, не решена окончательно и проблема отделения речевого сигнала от шумового фона. В настоящее время пользователи систем распознавания голоса вынуждены либо работать в условиях минимального шумового фона, либо использовать микрофонную гарнитуру. Что касается того чтобы команда, случайно высказанная в слух, не запустилась, была добавлена активация по «имени» машины. Например, «Автомобиль, включи фары». Для этого в предыдущем варианте обычно надо нажать кнопку принятия команды. Решение этих проблем началось, и уже получены многообещающие результаты. Одна из долгожданных разработок в области распознавания голоса - это человеко-машинные диалоговые системы. Система «умеет» работать с непрерывным речевым потоком и предпринимать ответные действия. Диалоговый интерфейс в системе позволяет человеку разговаривать с машиной, создавать и получать информацию, решать свои задачи.
Источники: http://e-box.com.ua/blog/sistema_golosovogo_upravleniya_avtomobilem