ПРОБЛЕМА СПІВВІДНОШЕННЯ РУЧНОГО ТА АВТОМАТИЗОВАНОГО ОЦІНЮВАННЯ МАШИННОГО ПЕРЕКЛАДУ

Автор(и)

DOI:

https://doi.org/10.31494/2412-9208-2022-1-3-379-388

Ключові слова:

машинний переклад, мова перекладу, мова оригіналу, покращення, контекстуальне значення, спілкування.

Анотація

Стаття присвячена розглядові особливостей розвитку та оцінки машинного перекладу, що може значно покращити глобальні комунікації, незважаючи на недосконалу якість вихідного тексту. Найчастіше результати онлайн-інструментів вимагають постредагування і можуть ефективно використовуватись лише тими, хто певною мірою вже говорить мовою перекладу. Потреба в якісному перекладі зростає з кожним роком. Сьогодні пошук алгоритму для забезпечення такої якості перекладу є одним із найважливіших питань інформатики та лінгвістики, що вказує на наукову новизну цієї роботи. У статті здійснено аналіз різних підходів до проєктування систем машинного перекладу, їхніх характеристик, ефективності та якості вихідного тексту. Основні проблеми, які ми бачимо в таких перекладах, пов’язані з тим, що системи залежать від великої кількості високоякісних наборів даних (тобто корпусів текстів для певних мовних пар). Якість цих наборів безпосередньо впливає на якість виводу, у нашому випадку це якість тексту цільової мови. Це можна побачити, порівнявши якість перекладу між системами Google і Microsoft. Перший у середньому робить менше помилок і не має стільки проблем щодо визначення контекстного значення полісемантичної лексеми. У статті підкреслено, що цю проблему певною мірою можна вирішити одним із двох способів: використати знання професійних перекладачів і лінгвістів для складання паралельних корпусів або створити можливість для кожної людини зробити внесок у цей процес навіть у невеликому масштабі. Перший підхід забирає багато часу та праці, але в підсумку надає нам більш якісний набір даних, що може призвести до подальшого покращення якості перекладу. Друга вже впроваджується всіма трьома основними системами наукового машинного перекладу, але може призвести до сповільнення прогресу через відсутність контролю за якістю. Потенційна перспектива цього дослідження полягає в розширенні предметної галузі текстів, обраних для відображення різноманітності стилів письма, що використовуються в Інтернеті зараз. Включення текстів конфесійного, ділового та інших стилів може дозволити нам виділити більше лакун у моделях нейронних мереж та запропонувати подальші шляхи вдосконалення.

Посилання

Вознюк М. Ю. Критерії оцінювання перекладу. Вісник ЛНУ імені Тараса Шевченка. 2011. № 9 (220). С. 143-149.

Chan S. Routledge Encyclopedia of Translation Technology. Oxon: Routledge, 2015. 285 p.

Darwish A. Transmetrics: A Formative Approach to Translator Competence Assessment and Translation Quality Evaluation for the New Millennium. 2001. URL : http://www.translocutions.com/translation/transmetrics_2001_revision.pdf

Forcada M. L. Making sense of neural machine translation. Translation Spaces, 2017. Iss. 6. P. 291-309.

Gordin M. D. Scientific Babel: How Science Was Done Before and After Global English. Chicago, Illinois: University of Chicago Press, 2015. 233 p.

Hearne M. Statistical Machine Translation: A Guide for Linguists and Translators. Language and Linguistics Compass 5(5). 2001. P. 205-226.

Hutchins W. J. Machine translation: past, present, future. New York City, 1986. 236 p.

Hutchins W. J. Machine translation: a concise history. New York, 2005. URL : https://pdfs.semanticscholar.org/e97a/40cc28ce17a17ce9b73d77e69ffa1210fa25.pdf.

Jurafsky D. Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. 2009. 2nd edition. Prentice Hall. 400 p.

##submission.downloads##

Опубліковано

2022-12-06