рефераты конспекты курсовые дипломные лекции шпоры

Раздел Программирование
/
Вид работы: Рефераты
/
ОПИСАНИЕ СОВРЕМЕННОГО СОСТОЯНИЯ ВОПРОСА

Реферат Курсовая Конспект

Выберите учебное заведение

ОПИСАНИЕ СОВРЕМЕННОГО СОСТОЯНИЯ ВОПРОСА

Работа сделанна в 2004 году

ОПИСАНИЕ СОВРЕМЕННОГО СОСТОЯНИЯ ВОПРОСА - Реферат, раздел Программирование, - 2004 год - Системы распознавания речи Описание Современного Состояния Вопроса. Как Хорошо Было Раньше Позвонив В Сп...

ОПИСАНИЕ СОВРЕМЕННОГО СОСТОЯНИЯ ВОПРОСА. Как хорошо было раньше Позвонив в справочную, можно было побеседовать с девушкой-оператором и даже назначить ей свидание.

Теперь же на том конце провода слышится приятный, но неживой женский голос, предлагающий набрать 1 для получения такой-то информации, 2 для связи с тем-то, 3 для выхода в меню и т.д. Все чаще доступ к информации контролируется системой, а не человеком. В этом есть своя логика однообразная, неинтересная работа выполняется не человеком, а машиной.

И для пользователя процедура получения информации упрощается назвал определенный набор цифр получил нужную информацию. Существующие технологии распознавания речи не имеют пока достаточных возможностей для их широкого использования, но на данном этапе исследований проводится интенсивный поиск возможностей употребления коротких многозначных слов процедур для облегчения понимания. Распознавание речи в настоящее время нашло реальное применение в жизни, пожалуй, только в тех случаях, когда используемый словарь сокращен до 10 знаков, например при обработке номеров кредитных карт и прочих кодов доступа в базирующихся на компьютерах системах, обрабатывающих передаваемые по телефону данные.

Так что насущная задача - распознавание по крайней мере 20 тысяч слов естественного языка - остается пока недостижимой.

Эти возможности пока недоступны для широкого коммерческого использования. Однако ряд компаний своими силами пытается использовать уже существующие в данной области науки знания. Существующие сегодня системы распознавания речи основываются на сборе всей доступной порой даже избыточной информации, необходимой для распознавания слов. Исследователи считают, что таким образом задача распознавания образца речи, основанная на качестве сигнала, подверженного изменениям, будет достаточной для распознавания, но тем не менее в настоящее время даже при распознавании небольших сообщений нормальной речи, пока невозможно после получения разнообразных реальных сигналов осуществить прямую трансформацию в лингвистические символы, что является желаемым результатом.

Сегодня в этом направлении работают уже не десятки, а сотни исследовательских коллективов в научных и учебных заведениях, а также в крупных корпорациях.

Об этом можно судить по таким международным форумам ученых и специалистов в области речевых технологий, как IICPHS и др. Результаты работы, на которую, как у нас образно говорят, навалились всем миром, трудно переоценить. Уже в течение нескольких лет голосовые навигаторы, или системы распознавания команд, успешно применяются в различных областях деятельности. Например, call-центр OmniTouch поставленный Ватикану компанией Alcatel, использовался для обслуживания мероприятий, проходивших в рамках празднования 2000-летия Христа.

Паломник, звонивший в call-центр, излагал свой вопрос, и система автоматического распознавания речи выслушивала его. Если система определяла, что вопрос задан по часто встречающейся теме, например о расписании мероприятий или адресах гостиниц, то включалась предварительно сделанная запись. При необходимости уточнить вопрос предлагалось речевое меню, в котором голосом надо было указать один из пунктов.

Если же система распознавания определяла, что предварительно записанного ответа на заданный вопрос нет, то происходило соединение паломника с оператором-человеком. В Швеции не так давно была открыта автоматическая телефонная справочная служба, использующая программу распознавания речи компании Philips. За первый месяц работы службы Autosvar, которая начала действовать без официального объявления, ее услугами воспользовались 200 тыс. клиентов.

Человек должен набрать определенный номер и после ответа автоматического секретаря назвать интересующий его раздел информационного справочника. Новая услуга предназначена в основном для частных клиентов, которые предпочтут ее из-за значительно меньшей стоимости услуг. Служба Autosvar является первой системой такого рода в Европе в США испытания аналогичной службы в компании ATT были начаты в декабре 2002 года. Вот несколько примеров использования этой технологии в США. Риэлтеры часто обращаются к услугам компании Newport Wireless.

Когда риэлтер проезжает на машине по улице и видит возле какого-нибудь дома табличку Продается, он звонит в Newport Wireless и запрашивает сведения о доме с таким-то номером, находящемся на такой-то улице. Автоответчик приятным женским голосом рассказывает ему о метраже дома, дате постройки и владельцах. Вся эта информация находится в базе данных Newport Wireless. Риэлтерам остается только выдать сообщение клиенту. Абонентская плата около 30 долл. в месяц.

Джули, виртуальный агент компании Amtrak, обслуживает железнодорожных пассажиров с октября 2001 года. Она по телефону сообщает о расписании поездов, об их прибытии и отправлении, а также производит бронирование билетов. Джули это продукт компании SpeechWorks Software и Intervoice Hardware. Она уже увеличила показатель удовлетворенности пассажиров на 45 13 из 50 клиентов получают всю нужную информацию из уст Джули. Раньше компания Amtrak использовала тоновую систему справки, однако показатель удовлетворенности тогда был меньше всего 9 клиентов из 50. В Amtrak признаются, что свою цену 4 млн. долл. Джули окупила за 12-18 месяцев.

Она позволила не нанимать на работу целую команду служащих. A British Airways экономит 1,5 млн. долл. в год, используя технологию от Nuance Communications, которая тоже автоматизирует справочную службу. Недавно Sony Computer Entertainment America представила Socom первую видеоигру, в которой игроки могут отдавать устные приказы бойцам из Deploy grenades.

В игре стоимостью 60 долл. применена технология ScanSoft. В прошлом году было продано 450 тыс. таких игр, что сделало Socom безусловным лидером продаж компании. Даже в медицине технология распознавания голоса нашла свое место. Уже разработаны аппараты осмотра желудка, послушные голосу врача. Правда, эти аппараты, по словам специалистов, пока еще несовершенны у них замедленная реакция на приказы врача. Но все еще впереди. В Мемфисе VA Medical Center вложил 277 тыс. долл. в программу Dragon, позволяющую врачам и медсестрам надиктовывать информацию в базу данных компьютера. Вероятно, скоро не нужно будет мучиться, чтобы разобрать в медицинской карте почерк врача.

Уже сотни крупных компаний используют технологию распознавания голоса в своей продукции или в услугах в их числе AOL, FedEx, Honda, Sony, Sprint, T. Rowe Price, United Airlines и Verizo. По оценкам экспертов, рынок голосовой технологии достиг в 2002 году порядка 695 млн. долл что на 10 выше, чем в 2001 году. Авиакомпания United Airways внедрила автоматическую справочную службу еще в 1999 году. Автоматические системы обработки телефонных звонков эксплуатируются такими компаниями, как инвестиционный банк Charles Schwab Со, розничная сеть Sears, сеть супермаркетов Roebuck.

Американские операторы беспроводной связи ATT Wireless и Sprint PCS уже больше года используют подобные программы и предоставляют услуги голосового набора. И хотя сейчас лидером по количеству call-центров такого типа является Америка, в последнее время выгоду от систем распознавания речи начали осознавать и в Европе.

Например, швейцарская служба железных дорог уже предоставляет своим немецкоязычным пассажирам услуги, аналогичные тем, что предлагает United Airways. 3.

Развернуть

Открыть в широком формате

– Конец работы –

Эта тема принадлежит разделу:

Системы распознавания речи

Ввод данных всегда требовал значительных затрат времени и сил, а стремление свести эти затраты к минимуму заставляет постоянно работать над… При современных масштабах распространения ПК работать с ними приходится не… Таким образом, задача состоит в том, чтобы научить компьютер понимать без посредника тот язык, на котором говорят люди…

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: ОПИСАНИЕ СОВРЕМЕННОГО СОСТОЯНИЯ ВОПРОСА

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

ИСТОРИЯ СОЗДАНИЯ И РАЗРАБОТКИ СИСТЕМ
ИСТОРИЯ СОЗДАНИЯ И РАЗРАБОТКИ СИСТЕМ. Соединенные Штаты Америки, конец 60-х годов XX века Три, сказал Валтер Кронкит Walter Cronkite, ведущий научно-популярной программы XXI век, во время демонстра

КАК ПРОИСХОДИТ РАСПОЗНАВАНИЕ РЕЧИ
КАК ПРОИСХОДИТ РАСПОЗНАВАНИЕ РЕЧИ. Процесс распознавания речи может быть разделен на две основные фазы оцифровка и декодирование. На первой фазе входной аудиосигнал записывается и разбивается на фр

АНАЛИЗ ОСНОВНЫХ ПРОБЛЕМ
АНАЛИЗ ОСНОВНЫХ ПРОБЛЕМ. На первый взгляд все очень просто если печатный текст распознается, то и речь тоже можно распознать, ведь компьютеру все равно, что обрабатывать звук или рисунок. Ка

МЕТОДЫ И МОДЕЛИ
МЕТОДЫ И МОДЕЛИ. Для успешного распознавания речи следует решить следующие задачи Ю обработку словаря фонемный состав, Ю обработку синтаксиса, Ю сокращение речи включая возможное использование жест

ПРОБЛЕМЫ СОЗДАНИЯ МНОГОУРОВНЕВОЙ СИСТЕМЫ РАСПОЗНАВАНИЯ РЕЧИ
ПРОБЛЕМЫ СОЗДАНИЯ МНОГОУРОВНЕВОЙ СИСТЕМЫ РАСПОЗНАВАНИЯ РЕЧИ. В современных компьютерных системах все больше внимания уделяют построению интерфейса естественным вводом-выводом информации распознаван

ПЕРСПЕКТИВЫ ИСПОЛЬЗОВАНИЯ
ПЕРСПЕКТИВЫ ИСПОЛЬЗОВАНИЯ. Возможности голосового управления открывают перед пользователями огромные перспективы. Если учесть, что сегодня во многих офисах компьютер управляет принтером, модемом, ф