Essays.club - Получите бесплатные рефераты, курсовые работы и научные статьи
Поиск

Комп’ютерний фонд української мови в Інституті мовознавства ім.О.О.Потебні НАН України

Автор:   •  Апрель 5, 2022  •  Реферат  •  1,292 Слов (6 Страниц)  •  245 Просмотры

Страница 1 из 6

КИЇВСЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ

ІМЕНІ ТАРАСА ШЕВЧЕНКА

Інститут філології

Кафедра української мови та прикладної лінгвістики

Реферат

на тему:

Комп’ютерний фонд української мови в Інституті мовознавства ім.О.О.Потебні НАН України

Студентки 2 курсу, 1 групи

спеціальності «Прикладна (комп’ютерна) лінгвістика

та англійська мова»,

Шимків Каріни Миколаївни

КИЇВ – 2021

     Стаття присвячена темі створення та формування комп’ютерних фондів як явища сучасного мовознавства. За логікою та структурую її можна поділити на п’ять основних розділів : історія становлення явища, джерельна база, принципи формування, здобутки та перспективи розбудови.

         Історія становлення починається ще в середині 50-х років минулого століття (перші фонди з’явилися у США, Великобританії, Італії, Франції, Німеччині та Швеції). Комп’ютерні ( або машинні) фонди національних мов замислювалися як скарбниці відомостей про будову та функціонування мови. Ставши можливими завдяки появі комп’ютерів, вони були покликані стати якісно новим фактичним підґрунтям для вивчення мови та опрацювання мовної інформації. В залежності від завдань, комп’ютерні системи могли бути словниково- або текстозорієнтированими базами даних про мову.

         На території колишнього Радянського Союзу першим почав розвивати цю ідею А.П.Єршов ( у кінці 70-х років минулого століття). Його метою було створення «повного словника та генератору словоформ, а також формалізованого тлумачного словника (тезаурусу) російської мови». У створенні машинних фондів мов вбачали нові можливості глибшого пізнання природи мови та успішне розв’язання нових, фундаментальних, раніше недосяжних для лінгвістів теоретичних та практичних дослідницьких завдань.

         У лютому 1983 року у м.Вороново , перша Всесоюзна конференція з проблем створення машинного фонду для автоматизованої системи лексикографічних досліджень (у складі якої були також присутні українські вчені з Інститутів мовознавства ім. О.О.Потребні та кібернетики ім.В.М.Глушкова ) ухвалила початок розробки Машинного фонду російської мови. Проект мав наступні завдання:

1.    Створення академічних словниково-граматичних баз даних.

2.    Формування автоматично поповнюваних словопокажчиків та словників на базі текстів ділових та розмовних стилів, а також текстів науково-технічної літератури й документації.

3.    Об’єднання в єдиний мовний фонд даних про загальновживану російську мову та даних термінологічних фондів.

4.    Створення фонду лінгвістичних алгоритмів та програм, включаючи процесори російської мови.

         На момент ухвалення проекту, в Україні вже понад 15 років велися дослідницькі роботи , пов’язані з моделюванням мовних явищ за допомогою комп’ютеру. В Інституті мовознавства ім. О.О.Потебні АН УРСР наприкінці 60-х років вже був створений відділ структурно-математичної лінгвістики на чолі з проф. В.С.Перебийніс, який активно працював над виробленням формалізованих моделей опису та інтерпретації мовних явищ. До ядра наукової групи також входили М.П.Муравицька, Т.О.Грязнухіна, Н.П.Дарчук, Л.В.Орлова, В.І.Критська, Л.І.Комарова, Т.К.Пуздирєва та Т.І.Недозим. Тому саме цей колектив був найбільш підготовленим до реалізації проекту та одразу почав формування повнотекстових баз даних. Формуванню джерельної бази слугували як наукові , так і художні й публіцистичні тексти. На сьогодні повнотекстова база даних фонду містить близько 700 тис. слововживань, оснащена процедурами орфографічного контролю текстів, аналізу їхньої морфологічної, синтаксичної та семантичної структури. Для опрацювання створених баз даних розроблені спеціальні текстові процесори, які включають системи комп’ютерного аналізу тексту на різних рівнях його будови: морфологічному, синтаксичному, логіко-семантичному (система АГАТ). До складу таких процесорів ввійшли також системи автоматичного орфографічного контролю й редагування текстів та система машинного російсько-українського та українсько-російського перекладу (системи РУТА і ПЛАЙ).

...

Скачать:   txt (17.7 Kb)   pdf (96.9 Kb)   docx (12.5 Kb)  
Продолжить читать еще 5 страниц(ы) »
Доступно только на Essays.club