рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Как переводит компьютер

Работа сделанна в 2000 году

Как переводит компьютер - раздел Лингвистика, - 2000 год - Машинный перевод Как Переводит Компьютер. Во-Первых, Всем Ясно, Что Чем Больше Словарь, Тем Лу...

Как переводит компьютер. Во-первых, всем ясно, что чем больше словарь, тем лучше перевод, значит, первая проблема - проблема создания больших словарей для систем. Во-вторых, ясно, что система должна переводить такие предложения Привет, как дела Значит, еще одна проблема - научить систему распознавать устойчивые обороты. В-третьих, понятно, что предложение для перевода пишется по определенным правилам, по определенным правилам переводится, а значит, есть еще одна проблема записать все эти правила в виде программы. Вот, собственно, и все. Самое интересное, что эти проблемы действительно являются основными при разработке систем МП, другое дело, что методы их решения известны далеко не всем и отнюдь не так просты, как может показаться.

Системы МП семейства PROMT PROgrammer s Machine Translation Компания ПРОМТ основана в 1991 году. Компания специализируется в разработке систем автоматического перевода для европейских языков и является лидером в этой области.

В 1993-97 годах ПРОМТ была признана одной из 100 Наиболее Влиятельных Компаний в компьютерном бизнесе России. В 1995 и 1998 годах компания получила награду за значительный вклад в развитие информационных технологий России очень хороший объект, чтобы продемонстрировать, каким образом эти проблемы могут решаться эффективно. 4. 1. СЛОВАРЬДля качественного перевода очень важно, чтобы практически все слова исходного текста легко было найти и в словаре системы.

А те из них, которых в нем нет, переносятся в текст непереведенными уже на выходе из системы, и их впоследствии переводят вручную при редактировании результатов перевода. Такие слова могут повлиять на качество перевода предложения. Дело в том, что для определения, к какой части речи относится рассматриваемое слово, система производит анализ всего предложения в целом. При этом имитируется мыслительная деятельность человека такую систему принято называть системой с элементами искусственного интеллекта. Если значение хотя бы одного слова в предложении не определено, то это может исказить анализ всего предложения, а иногда и результаты всего перевода.

Методы организации больших баз данных достаточно хорошо разработаны, но для перевода не менее, а может быть, и более важно правильно структурировать информацию, которая приписывается элементу базы, правильно выбрать этот самый элемент. Сколько, например, записей в словаре должно соответствовать обыкновенному русскому слову программа ? И, вообще, большой словарь - это словарь, который содержит много словарных статей, или словарь, который позволяет распознать много слов из текста? При ближайшем рассмотрении оказывается, что, например, существительные в русском языке изменяются по падежам и по числам, то есть для одного существительного может существовать до 12 разных форм, а для глаголов и прилагательных, как правило, существует еще большее количество различных форм более тридцати. Следовательно, чтобы переводить предложения, содержащие слова программу, программе, программы и т.д хорошо было бы иметь способ соотнесения словарной статьи из автоматического словаря для слова программа с соответствующей словоформой из текста.

Поэтому для описания и входного, и выходного языка в системе должен существовать некоторый формальный метод описания морфологии, на котором основывается выбор единицы словаря.

В системах семейства PROMT разработано практически уникальное по полноте морфологическое описание для всех языков, с которыми системы умеют обращаться.

Оно содержит 800 типов словоизменений для русского языка, более 300 типов как для немецкого, так и для французского языка, и даже для английского, который не принадлежит к флективным языкам, выделено более 250 типов словоизменений. Множество окончаний для каждого языка хранится в виде древесных структур, что обеспечивает не только эффективный способ хранения, но и эффективный алгоритм морфологического анализа.

Кроме того, используемая модель морфологии позволила разработать экспертную систему для пользователя - создателя словаря. Эта система фактически автоматизирует процедуру выделения основы и определения типа словоизменения при вводе новых словарных статей. Однако разработка описания морфологии позволяет решить только проблему того, что является заголовком словарной статьи, по которому происходит идентификация единицы текста и единицы словаря. Но ведь идентификация слова из текста со словарной статьей происходит не ради идентификации, как это требуется в электронных словарях, она необходима для выполнения программой собственно процедур перевода.

Какая же нужна информация в словарной статье и как должны быть описаны правила перевода для того, чтобы программа переводила? 4. 2. ГРАММАТИКАС развитием МП как области прикладной лингвистики появилось множество лингвистических работ, предлагавших структуру описания свойств живого слова в словарной статье машинного словаря.

При этом совершенно отдельно появлялись исследования, описывающие, например, структуру именной группы или способы выражения прямого дополнения для глаголов говорения. Например, на основе признака принадлежность к части речи описывалась грамматика такого типа именная группа - это существительное именная группа - это прилагательное именная группа глагольная группа - это глагол именная группа предложение - это именная группа глагольная группа Понятно, что некоторая часть предложений естественного языка описывается такой грамматикой, но эта часть очень незначительна, и на ее основе нельзя правильно анализировать и переводить хоть сколько-нибудь реальный текст.

Но зато можно использовать эффективные методы построения преобразователя по заданной грамматике или, на худой конец, написать программу, которая путем перебора построит деревья зависимостей для ограниченного множества предложений. Стало принятым делить системы перевода на системы типа TRANSFER и системы типа INTERLINGUA. Это разделение основано на особенностях архитектурных решений для лингвистических алгоритмов.

Алгоритмы перевода для систем типа TRANSFER строятся как композиция трех процессов анализ входного предложения в терминах структур входного языка, преобразование этой структуры в аналогичную структуру выходного языка TRANSFER и затем синтез выходного предложения по полученной структуре. Системы типа INTERLINGUA предполагают априори наличие некоторого метаязыка структур INTERLINGUA , на котором можно описать все структуры как входного, так и выходного языков в общем случае поэтому алгоритм перевода в системе типа INTERLINGUA предполагается как более простой анализ входного предложения в терминах метаязыка и затем синтез из метаструктуры соответствующего предложения выходного языка.

Единственная сложность в этом случае - разработать сам метаязык и описать естественный язык в соответствующих терминах. Несмотря на то, что эта классификация существует, и в среде разработчиков МП считается хорошим тоном спросить, к какому типу относится ваша система, не было разработано еще не одной реальной системы, основанной на принципе INTERLINGUA. Поэтому анализ простых предложений как структур, состоящих из синтаксических единиц, выполняется на основе фреймовых предикатных структур, которые позволяют эффективно выполнять преобразования.

Глагол считается для простых предложений главным элементом и его валентности определяют заполнение соответствующего фрейма.

Для каждого типа фреймов существует некоторый закон преобразования в выходной фрейм и оформление актантов. Таким образом, осуществляется TRANSFER на уровне предложений. Анализ сложных предложений требуется в случае формирования согласования времен и правильного перевода союзов. Хотелось бы надеяться, что эти сведения позволят потенциальным пользователям систем перевода понять, что создание системы МП - задача не такая уж простая, и, что называется, наукоемкая. А, следовательно, количество действительно пригодных к использованию систем перевода, которое может появляться в единицу времени, принципиально ограничено. В любом случае, стилистические и грамматические огрехи машинного перевода компенсируются потрясающей скоростью получения его чернового варианта. 5. ОТВЕТ КРИТИКАМ МАШИННОГО ПЕРЕВОДА или Почему популярны программы-переводчикиПрежде чем рассказать подробнее о множестве программ-переводчиков, мне хотелось бы ответить на самый, на мой взгляд, распространенный вопрос, который поднимается, как только заходит речь о МП Переводы с русского на английский и с английского на русский не выдерживают никакой критики.

Неужели полноценный машинный перевод остается все еще делом будущего? Можно, конечно, было бы проигнорировать этот вопрос, хотя бы потому что сам уровень организации, проводившей тестирование вне подозрений, да и популярность как систем, так и сервиса в Интернете, организованном на сайте http www.translate.ru более 200.000 переводов за месяц демонстрируют полезность и востребованность МП. Однако именно сейчас, в первую очередь в связи с развитием Интернет, когда МП становится все более и более необходимым обществу, нам представляется полезным обсудить еще раз тему нужны или не нужны системы МП. В нашей стране разработка систем МП ведется уже более 35 лет, а специалисты компании ПРОМТ занимаются этой проблемой более 20 лет, однако до сих пор эта сфера компьютерной индустрии вызывает много различных дискуссий.

Часто приходится слышать от критиков систем МП Программы-переводчики переводят плохо, непонятно кому они вообще нужны.

Гораздо проще отдать текст живому переводчику или выучить язык самому. Причем, к сожалению, резкость критики зачастую бывает обратно пропорциональна знанию языка.

Компания, безусловно, не пытается обвинить в этом критиков и полагает, что лично им движет стремление к совершенству. Итак, компьютер пока во многом не может заменить переводчика. Стоит ли тогда вообще применять системы машинного перевода? Конечно, стоит.

Если компьютер используется для перевода литературных текстов, то получается черновой вариант текста, так называемый подстрочник, который превращается в произведение искусства человеком, слабо владеющим языком оригинала, но являющимся хорошим литературным редактором. Если же речь идет о переводе технических текстов, то здесь при правильном выборе словаря по специальности, в рамках которой написан текст, получается вполне удовлетворительный результат, иногда не требующий последующего вмешательства.

Вообще необходимость редактирования компьютерного перевода очень часто возникает в связи с проблемами, перечисленными выше. Для этого системы машинного перевода обязательно имеют средства редактирования текстов. Для некоторых заказчиков такой уровень перевода просто неприемлем. Машинный перевод - это миф считает Линн Сешедри, консультант одной из служб корпорации Electronic Data Systems Плейно, шт. Техас, принимавший участие в создании глобальной интрасети компании Возможно, он годится для технической документации, но во всех остальных случаях вы получаете 15 смысла и 85 ерунды. Для перевода содержания своей интрасети EDS пользуется услугами профессиональных переводчиков на контрактной основе. Однако других машинный перевод вполне устраивает, в значительной степени потому, что часто ему просто нет реальных альтернатив.

Парижский фонд За развитие гуманизма FPH в свое время также стоял перед выбором тратить ли существенную часть своего бюджета на переводчиков или испробовать средства машинного перевода.

Эта организация, финансируемая из частных источников, выпускает доклады по экологии, экономике и ряду других областей, привлекая для их создания интернациональные коллективы ученых. Ее выбор пал на технологию машинного перевода, а точнее, на продукт фирмы Globalink, представляющий собой вполне качественное и недорогое приложение для ПК. FPH установил его на сервер электронной почты, чтобы общение специалистов, говорящих на разных языках, было проще и эффективнее.

Это хорошее решение считает Марина Урквиди, консультант из FPH Многие люди предпочли бы работать не на английском, а на своем родном языке. Теперь у них есть такая возможность. Она не отрицает, что машинный перевод имеет свои недостатки, однако убеждена, что если человек захочет, он сможет понять перевод, сделанный машиной. Если вы немного подумаете, то сумеете понять, о чем идет речь. Таким образом, если не требовать от МП слишком многого, то, возможно, обещание Бэббиджа о машинном переводе все же исполнится. 6.

– Конец работы –

Эта тема принадлежит разделу:

Машинный перевод

Своими корнями он восходит к тем далеким временам, когда праязык начал распадаться на отдельные языки и возникла необходимость в людях, знавших… Переводом называется процесс и результат создания на основе исходного текста… При этом коммуникативная равноценность, или эквивалентность, понимается как такое качество текста перевода, которое…

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Как переводит компьютер

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

История развития машинного перевода
История развития машинного перевода. По свидетельству биографов, еще выдающийся математик XIX века Чарльз Бэббидж пытался убедить британское правительство в необходимости финансировать его исследов

Машинный перевод - это инструмент
Машинный перевод - это инструмент. Всем хорошо известно, что хороший перевод текста - это не только творческая, но и достаточно трудоемкая работа. Причем даже самый хороший перевод, как прав

Переводчик для офиса
Переводчик для офиса. Итак, машинный перевод уже довольно уверенно вошел в повседневную жизнь современного офиса и ни у кого не вызывает удивления. В мире существует очень много программ МП.

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги