ОСОБЛИВОСТІ МОРФОЛОГІЧНОЇ РОЗМІТКИ КОРПУСІВ УКРАЇНСЬКОЇ МОВИ НА ПРИКЛАДІ ТЕХНІЧНОЇ ДОКУМЕНТАЦІЇ

Автор(и)

  • Svitlana Petrasova
  • Maria Kuzmina
  • Ilya Manuilov

DOI:

https://doi.org/10.20998/2227-6890.2017.52.20

Ключові слова:

морфологічна розмітка, корпус текстів, технічна документація, тегсет

Анотація

У статті розглядаються особливості автоматичної морфологічної розмітки корпусів текстів української мови. Створено корпус текстів української мови, які представляють інструкції технічної документації. Розроблено систему тегів для формалізації морфологічної інформації. Описано розроблену програмну реалізацію запропонованого методу автоматичної морфологічної розмітки, що дозволяє отримувати з корпусу технічної документації приклади вживання в мові як конкретних словоформ, так і слів у всіх їх граматичних формах.

Посилання

Герд А.С. Прикладная лингвистика / А.С. Герд – СПб. : Изд-во С.-Петерб. ун-та, 2005. – 268 с.

Большакова Е.И. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика / Е.И. Большакова, Э.С. Клышинский, Д.В. Ландэ и др.– М. : МИЭМ, 2011. – 272 с.

Демська-Кульчицька О.М. Основи національного корпусу української мови / О.М. Демська-Кульчицька. – К. : Інститут української мови НАНУ, 2005. – 219 с.

Корпус текстів української мови [Електронний ресурс]. – Режим доступу : http://www.mova.info/corpus. aspx?l1=209. – Дата звертання : 25 жовтня 2017.

Бобкова Т.В. Корпус текстів з комп’ютерної лінгвістики / Т.В. Бобкова та ін. // Комп’ютерні науки та інформаційні технології : матеріали 4-ї Міжнародної науково-технічної конференції, 17 жовтня 2009 р. – Львів, 2009. – С. 405–407.

Український національний лінгвістичний корпус [Електронний ресурс]. – Режим доступу : http://unlc.icybcluster. org.ua/virt_unlc/ – Дата звертання : 25 жовтня 2017.

Данилюк І.Г. Корпус текстів для вивчення граматичної службовості: класифікація граматичних класів і підкласів / І.Г. Данилюк // Лінгвістичні студії. – Донецьк : ДонНУ, 2013. – № 27. – С. 221–229.

Старко В.Ф. Формування браунського корпусу української мови / В.Ф. Старко // Мовні і концептуальні картини світу. – 2014. – № 48. – С. 415–421.

Бабина О.И. Автоматизация лингвистической разметки корпуса текстов [Електронний ресурс] / О.И. Бабина, Н.Ю. Дюмин. – Режим доступу : http://helling100./pubs/AutomationBabinaDyumin.pdf. – Дата звертання : 25 жовтня 2017.

Система Mystem [Електронний ресурс]. – Режим доступу : https://tech.yandex. ru/mystem/ – Дата звертання : 25 жовтня 2017.

Система Stemka [Електронний ресурс]. – Режим доступу : http://linguist.nm.ru/stemka/ stemka.html – Дата звертання : 25 жовтня 2017.

Програма відмінювання [Електронний ресурс]. – Режим доступу : http://morpher.ru/ DemoUA.aspx. – Дата звертання : 25 жовтня 2017.

Система ОРФО – [Електронний ресурс]. – Режим доступу : http://www.orfo. ru/features/ – Дата звертання : 25 жовтня 2017.

Бабина О.И. Корпусный метод автоматического морфологического анализа флективных языков / О.И. Бабина, Н.Ю. Дюмин // Вестник Южно-Уральского гос. ун-та, 2012. – № 25. – С. 38–44.

##submission.downloads##