Структура приемника информации – машины

Для решения задачи коммуникации со стороны машины должны быть реализованы те же функции, что и со стороны человека – реципиента речевой посылки. Следовательно, и архитектура ее алгоритмов должна быть такой же, или похожей. Необходимо заметить, что эта тождественность реализуется на верхних уровнях отображения информации, на нижних же, в силу специфики обработки информации человеком (строго параллельно) и машиной (сугубо последовательно), в машинном варианте используются специфические алгоритмы обработки сигналов, имеющие строгое математическое обоснование. Хотя и в этом случае иногда привлекается психологическая эмпирика.

Традиционно в лингвистике рассматриваются следующие уровни представления речевой информации [10]: (1) уровень субфонемных элементов; (2) фонем; (3) корневых и флективных морфем, слогов; (4) слов; (5) уровень фразовых структур. Семантический и прагматический уровни представления знаний реализуются на стыке речевой и многомодальной моделей мира.

Системы распознавания речи можно подразделить на четыре основных категории:
1. Системы покомандного распознавания
2. Системы распознавания ключевых слов в потоке слитной речи
3. Системы распознавания связной речи
4. Системы распознавания слитной речи

Имеется ряд дополнительных критериев классификации систем распознавания речи:

• Система распознавания может обучаться на индивидуальные особенности речи конкретного диктора.

• Система может быть рассчитана на конкретный стиль произнесения: быстро, медленно, тихо, громко, шепотом, в условиях физической нагрузки, в шумах.

• Система может быть предназначена для работы в разных акустических условиях.