Например, Бобцов

Разработка ядра синтаксического анализатора для русского языка на основе библиотек NLTK

Сборник тезисов
Конференция:XIX Объединенная научная конференция «Интернет и современное общество» (IMS‑2016)
Раздел:КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА И ВЫЧИСЛИТЕЛЬНЫЕ ОНТОЛОГИИ
Рубрика:РАЗДЕЛ 1.
Год:2016

Разработка ядра синтаксического анализатора для русского языка на основе библиотек NLTK

УДК:

Аннотация

Целью проекта является создание синтаксического анализатора для русского языка с использованием инструментов NLTK для Python. В NLTK есть возможность создавать категориальные грамматики (feature-based grammars), основывающиеся на морфологической информации о входном тексте. При написании правил грамматики мы опираемся на систему морфологической разметки, принятую в морфоанализаторе PyMorphy2. На данный момент создано ядро синтаксического анализатора, рассчитанное на обработку основных синтаксических групп внутри простого предложения для русского языка. В будущем мы планируем расширить функционал парсера так, чтобы он мог анализировать любые грамматически верные предложения русского языка.

Материалы конференций