рефераты конспекты курсовые дипломные лекции шпоры

Раздел Информатика
/
Вид работы: Рефераты
/
Система распознавания речи

Реферат Курсовая Конспект

Выберите учебное заведение

Система распознавания речи

Работа сделанна в 2009 году

Система распознавания речи - Реферат, раздел Информатика, - 2009 год - Особенности взаимодействия «человек-компьютер» Система Распознавания Речи. Самым Сложным Для Машины Является Автоматическое ...

Система распознавания речи. Самым сложным для машины является автоматическое распознавание слитной речи. Разработка систем автоматического распознавания речи ведет к тому, что не человек приспосабливается к машине, а машина к человеку.

Это значительно упрощает коммуникацию в системе «человек-компьютер», так как она ведется на естественном для человека языке.

Люди получают возможность наговаривать информацию в компьютер, не прибегая к клавиатуре или другим устройствам, и управлять механическоми устройствами с помощью речевых команд. [1, с.304] В начале 40-х годов ХХ века инженеры впервые попытались распознать с помощью машины отдельные звуки речи, однако оказалось не так просто найти соответствие между конкретными звуками речи человека и акустическими характеристиками речевого сигнала.

Компьютер учился считывать буквы, но еще не мог распознать человеческую речь. И не смотря на то, что изначально люди предполагали, что научиться «разговаривать» с машиной не окажется сложной задачей, проблема взаимодействия с компьютером посредством речи до сих пор стоит перед учеными. «Можно представить себе, перед решением каких трудных задач стоит машина, которой нужно из безбрежного океана звучаний «выловить» определенные смысловые ориентиры». [2, с.88] Что касается гласных, если компьютер уловит частотные колебания в области 1000 ГЦ, то велика вероятность того, что бы произнесен гласный «а», если же он обнаруживает сильные колебания в зоне 2000-3000 Гц, есть вероятность присутствия звука «и». Однако с согласными дело обстоит хуже. Машине сложно уловить смычные взрывные согласные «г», «к», «б», «п», «д», «т». Они не уловимы сами по се бе, так как образуются при смыкании тех или иных органов артикуляции.

Распознать их в речи легче по соседним гласным.

Машина также часто путает такие сонорные звуки, как «м» и «н». Легче дело обстоит с распознаванием шипящих звуков «ш» и «с», их частоты колеблются в районе высоких частот спектра: 8000-10000 Гц. К лингвистическим трудностям добавляются и такие, которые возникают вследствие большой вариативности звуков речи при их произнесении. Кроме того, звуки в процессе включения в речевой поток по падают в разное окружение, разный фонетический контекст, что усложняет способность распознования речи машиной.

Для того чтобы машина смогла распознать не только звуки, но и целые слова, фразы, она должна включать в себя несколько блоков рецепторов, классификаторов, эффекторов. Рецептор измеряет некоторые параметры речевого сигнала. Затем классификатор выносит решение о том, что это за слог. Другой классификатор определяет, принадлежит ли этот слог произнесенному слову, образец которого находитс я у него в памяти, и т.д. Таким образом, распознающая машина решает следующие задачи: 1. Какие элементы набора признаков она должна распознать? 2. На какие признаки следует обратить внимание? 3. По каким правилам надо принять решение о том, к какому элементу набора признаков относится речевой сигнал? 4. Какие дополнительные сведения, знания следует привлечь для более правильного решеия задачи? Чтобы машина распознавала слова, ее вначале обучали, как они произносятся и что обозначают.

Для этого слова п роизносились в магнитофон или записывались на пленку.

Машина тем временем сравнивает произнесенные слова с образцами слов, хранящимися у нее в памяти, а также характеристики голоса человека, произносящего слово, с образцами голосов, хранящимися у нее в памяти. При этом различают адаптивные и неадаптивные машины. Адаптивные предназначены для какого-то узкого круга лиц, голос которых они распознают, другого человека машина не сможет распознать. Неадаптивные предназначены непосредственно для любого пользователя.

Иногда возни кают такие помехи как различного рода шумы (дыхания, разговоров на заднем плане и т.п.). Для их подавления используются специальные шумоподавляющие, шумостойкие микрофоны либо акустически изолированные камеры.[2, с.88-95] Системы распознания отдельных слов, т.е. речи, в которой слова разделены паузами, появились уже в 90-е гг. прошлого века. Распознать же слитную речь было намного труднее, так как в ней сложно определить, где кончается одно слово и начинается другое.

Наиболее трудной задачей из всех задач распознавания была я является проблема распознания речи без ограничений словарного запаса. «Говорящий в процессе речевой коммуникации использует свое знание языка, знание об окружающей обстановке и ситуации при производстве и понимании сообщения. Эти источники знаний включают в себя характеристики звуков речи, произносительную вариативность, ударение и интонационный контур речи, звуковые образы слов, грамматическую структуру языка значение слов и предложения и контекст общения.

Для того, чтобы походить в своих дейс твиях на человека, машина должна так же эффективно использовать все доступные источники знаний».[1, с.305] Конечно, ответственность за то, чтобы машина полностью понимала человека, лежала и лежит на самом человеке. Ученые проводили и проводят массу исследований в этой области, а результаты экспериментов часто лежат в основе функционирования той или иной системы. «Современные системы распознавания включают различные уровни, каждый из них несет свою функциональную нагрузку: акустический, параметрический, лексический, синтаксический, семантический и прагматический»[1, с. 505] Трудности и проблемы при распознавании речи ЭВМ Распознавание живого языка требует огромных знаний системы об окружающем мире и возможности с ним взаимодействовать.

Само определение смысла слова «понимать» — одна из главных задач искусственного интеллекта. Качество понимания зависит от множества факторов: от языка, от национальной культуры, от самого собесед ника и т. д. Вот основные проблемы, с которыми сталкиваются разработчики систем распознавания речи. 1. Проблема анализа и распознавания слитной речи. В слитном потоке речи отсутствуют объективные границы.

Кроме того фонемы слов, т.е. звуки, в них входящие, часто зависят от контекста, число же их огромно. 2. Проблема увеличения объема словаря: это влечет за собой рост ошибок распознавания и увеличение времени принятия решения.

При большом объеме словаря появляется слишком много схожих слов, что альтернативный п одбор слова в случае его нераспознания машиной, вряд ли решит проблему. 3. Проблема использования синтаксиса: сколько допустимых ограничений может наложить искусственный синтаксис языка, и как эти ограничения могут быть использованы. Связь синтаксического и фонетического уровней необходима и полезна для распознавания слитной речи. Роль синтаксического анализа сводится к тому, чтобы сформировать грамматическую цепочку, свободную от ошибок. Вот пример сложностей, с которыми сталкиваются системы понимания текстов: предложения «Мы отдали бананы обезьянам, потому что они были голодные» и «Мы отдали бананы обезьянам, потому что они были перезрелыми» похожи по синтаксической структуре.

В одном из них местоимение «они» относится к обезьянам, а в другом — к бананам. Правильное понимание зависит от знаний компьютера, какими могут быть бананы и обезьяны. По нормам русского языка второе предложение некорректно, потому что в нем местоимение ссылается не на по следнее подходящее слово, однако в живой речи такое предложение очень даже может встретиться.

Свободный порядок слов может привести к совершенно иному толкованию фразы: «Бытие определяет сознание», кто здесь кого определяет, будет непросто понять машине. В русском языке свободный порядок компенсируется развитой морфологией, служебными словами и знаками препинания, но в большинстве случаев для компьютера это представляет дополнительную проблему. 4. Проблема неоднозначности языка, распознавания омонимов и неологи змов. В речи могут встретиться неологизмы, например, глагол «Пятидесятирублируй» — то есть высылай 50 рублей.

Система должна уметь отличать такие случаи от опечаток и правильно их понимать. Правильное понимание омонимов – нелегкая задача для компьютера. Во фразе «Серый волк в глухом лесу встретил рыжую лису» выделенные слова слышатся одинаково, и без знания, кто глухой, а кто рыжий, не обойтись (Кроме того, что лиса может быть рыжей, а лес — глухим, лес также может быть рыжим (характеристика, в данн ом случае обозначающая преобладающий цвет листвы в лесу), в то время как лиса может быть глухой, что порождает дополнительную проблему, вытекающую из предыдущей.) 5. Проблема распознавания речи пользователей.

Системы распознавания речи настраивают, как правило, небольшое количество дикторов, в итоге расширить круг пользователей является непростой задачей. Проблемами являются: пол, диалект, степень владения языком, т.е. языковой опыт диктора, и другие индивидуальные характеристики диктора.

Кроме того, даже голос одно го человека может звучать по-разному, в зависимости от того, чем он занят в конкретный момент, влияет также эмоциональное состояние человека, и его здоровье (каждый, наверное, сталкивался с явлением появления хрипоты в горле). Современные же системы требуют четкого и ясного произнесения слов. 6. Проблема подстройки: зачастую требуется серьезная предварительная настройка систем (например, неоднократное повторение слова диктором). При увеличении словаря скорее всего придется отказаться от солидной настройки систе м. 7. Проблема обучения пользователя синтаксису и словарю систем, что не намного легче, чем обучение языкам программирования.

Диктор не может без большого напряжения приобрести новые навыки в произношении и артикуляции. 8. Проблема шумов в окружающей обстановке. Современные системы распознавания достаточно чувствительны к шумам, которые могут исказить звуковой сигнал и препятствовать тем саамы распознанию речи. 9. Проблема машинного перевода текстов с одного языка на другой.

В современном мире большую роль играет разработка методов информационного поиска. [1, с.506-507; 4, с. 93-104; http://ru.wikipedia.org/wiki/Обработка_е стественного_языка]

Развернуть

Открыть в широком формате

– Конец работы –

Эта тема принадлежит разделу:

Особенности взаимодействия «человек-компьютер»

Современный человек намного больше общается с техническими устройствами, в особенности такими, как компьютер. Теперь он не просто облегчают человеку его работу, как умственную, так и… Компьютер в настоящее время является персональным помощником человека практически во всех сферах его деятельности. Он…

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Система распознавания речи