ReferatFolder.Org.Ua — Папка українських рефератів!


Загрузка...

Загрузка...

Головна Журналістика. ЗМІ. Радіо. Преса. Телебачення → Деякі аспекти машинного перекладу тексту

Надана документація (українською мовою) містить корисні попередження та поради, незважаючи на свій невеликий обсяг.

Для безперебійної роботи Language Master потрібні комп\'ютер на базі 486DX та вище, оперативна пам\'ять 4М (рекомендується 8М), операційне середовище Windows 3.x або операційна система Windows 95 чи WindowsNT, текстовий редактор Word для Windows.

Таким чином, існує програма машинного перекладу, що швидко розвивається, але не має власної оболонки, що, можливо, обумовлює вади та обмеження в роботі з нею.

Далі наведемо результати тестування вищеназваних програмних продуктів (див. табл. 1). Для експерименту застосовувався комп\'ютер на базі процесора Pentium-200 з оперативною пам\'яттю 32М, файли вихідного тексту розміром 6К та п\'ятибальна шкала оцінок.

В оцінці якості перекладу враховувались граматичні, синтаксичні та стилістичні оцінки з рівною вагою.

Тепер зупинимось більш конкретно на вадах отриманих перекладів. Як вже зазначалось вище, варіант машинного перекладу є лише початковим матеріалом, звичайно, дуже недосконалим, який обов\'язково підлягає подальшій ретельній обробці. Зупинимось детальніше на деяких вадах одержаних перекладів з англійської. Як відомо, деякі англійські іменники і дієслова мають однакове написання та транскрипцію, або трохи відрізняються за вимовою, що, звісно, для письмового перекладу неважливо. Їх морфологічну належність визначає або артикль (для іменників), або частка \"to\" (для дієслів). Тому, коли ці визначники присутні в тексті, машинний перекладач дає більш-менш адекватний український (російський) еквівалент. Якщо ж іменник (наприклад, \"work\") вжито без артикля, або дієслово стоїть після модального дієслова (\"can\",\"must\" та ін.) і не потребує частки \"to\", можливі хибні варіанти перекладу. Наприклад, англійському \"must work\" відповідає в усіх трьох перекладених текстах російське неправильному \"должны работа\". Ця проблема може бути усунена. Для цього текстовий аналізатор має враховувати, що після модального дієслова безпосередньо можуть стояти лише різні форми інфінітива (за винятком простих відповідей на зразок \"I can\"). Поширимо наш вираз до \"must work hand in hand\". Як показало тестування, знову маємо незадовільний переклад останніх трьох слів, адже проблема і тут стосується розпізнання іменника \"hand\" та фразового дієслова \"hand in\". Одержали такі варіанти перекладів російською мовою \"рука в руке\" (STYLUS 3.0), \"вручают руку\" (ПАРС 3.9) та українською \"пліч-о-пліч\" (Language Master 5.5). Зрозуміло, що правильним є тільки останній переклад. До речі, артиклі в англійському тексті звичайно не викликають ускладнень у розумінні змісту, адже з контексту здебільшого зрозуміло, що мається на увазі в оригіналі: \"a company\" — будь-яка компанія або ж \"the company\" — та конкретна компанія, про яку йшлося вище. Машинні перекладачі припускаються помилок у розумінні англомовної конструкції \"complex object\", якій в більшості випадків відповідає складнопідрядне речення. Так, фразу \"to enable Europe to become one community\" можна перекласти \"зробити можливим, щоб Европа стала єдиною спільнотою\" або \"допомогти Європі стати єдиною спільнотою\". З першим варіантом перекладач впорається, якщо навчити його формувати підрядне речення, підметом якого є додаток (у нашому випадку \"Europe\") конструкції \"complex object\".

Деякі аспекти машинного перекладу тексту

Таким чином, машинні перекладачі текстів більш-менш задовільно складають скелет майбутнього перекладу за рахунок, як правило, дослівної обробки тексту, причому з кількох можливих значень слів обирається частіше за все загальновживане. Така ситуація навряд чи зможе задовольнити фахівця певної галузі.

Зупинимось на перекладі в зворотному напрямку. На відміну від української (російської), англійська мова не є мовою флексій. Останні залишились тільки у двох випадках, а саме: для позначення множини іменників (\"dog\"-\"dogs\") та присвійного відмінка (\"a girl\'s dall\"), але зміст речення цілком однозначно визначається строгим порядком слів у реченні (підмет-присудок-другорядні члени). Тому не виникає проблеми у визначенні програмою машинного перекладу об\'єкта та суб\'єкта дії. Навпаки, українська (російська) мова припускає довільний порядок слів у реченні відповідно до логічного наголосу. Викликають труднощі, наприклад, звороти такого типу \"разъяснить, что обозначают аббревиатуры такого типа\"(рос.). У підрядному реченні російське \"что\" може виступати або як відносний займенник, і в цьому випадку він є додатком до складнопідрядного речення та перекладається англійським \"what\", або як сполучник, тому перекладається англійським \"that\". Програмне забезпечення, що розглядається, цих ситуацій не розрізняє і переклало цей вираз через \"that\", що є, звичайно, помилковим.

Звертає увагу неправильний переклад англійських усталених зворотів, зокрема, зловживання прийменником \"of\" родового відмінка замість того, щоб знаходити більш природні еквіваленти. Так російському словосполученню \"Министерство обороны\" скрізь відповідає \"the Ministry of[the|a|без артикля] defense\", тимчасом як правильним було б \"the Defense Ministry\".

Ще однією проблемою, яку неможливо обминути, є правильне відображення колокацій, слів, що завжди вживаються поруч. Із двох фраз \"the war breaks out\" та \"the war irrupts\" англієць віддасть перевагу другій, але програми-перекладачі не відстежують такі ситуації.

Отже, в першому наближенні до цієї проблеми можна вирізнити два напрямки вдосконалення якості машинного перекладу: програмний та технічний. Програмний напрямок має за мету вдосконалення SOFT-забезпечення, тобто самого алгоритму програми, створення механізму системи, що самонавчається; технічний — розширення бази словників, усталених словосполучень та зворотів, а також диференціацію перекладачів за різною тематикою, реалізацію різних принципів відбору слів (статистичного, тематичного, контекстного).

На жаль, у межах однієї статті не можна обговорити весь спектр проблем цієї області. У будь-якому випадку користувач повинен володіти мовою хоча б на початковому рівні, щоб самостійно завершити переклад.

Взагалі не має сенсу говорити про успіх таких програм без плідної співпраці у їх створенні фахівців високого класу як в галузі прикладної математики, так і в галузі мовознавства.

Література

Бєлов Ю.А., Проценко В.С., Чаленко П.Й. Інструментальні засоби програмування.—К.: Либідь, 1993.Гудмэн Дж. Управление памятью для всех. —К.: Диалектика, 1995.Зелинский С. Английский бы выучил только за то ... // CHIP. Компьютерный журнал. —1997.—№ 11.—C. 50—56.