Другие журналы
Сетевое издание Машины и установки: проектирование, разработка и эксплуатация

Издатель ФГБОУ ВПО "МГТУ им. Н.Э. Баумана". Эл. № ФС 77-61859. ISSN 2412-592X

Публикации с ключевым словом - Apache UIMA

Найдено: 1
Применение Apache UIMA при решении задачи выделения имён из текстов документов
# 02, февраль 2013
УДК: 004.91
Гречищев К. М.
Демонстрируется применение средств семантического фреймворка Apache UIMA с использованием разработанного способа автоматического выделения имен собственных из документов на естественном языке. Идея метода заключается в использовании шаблонов на основе регулярных выражений. При последующем морфологическом анализе подходящих под шаблон частей текста происходит определение начальных форм термов и проверка их по словарю. Задача решается средствами семантического фреймворка Apache UIMA путем использования входящих в его состав модулей (аннотаторов), а также реализации собственных. Способ тестировался на коллекции произведений русской классической литераторы, а также на искусственно сгенерированных текстах. Оценивалось число правильно обнаруженных имен, а также число ложных срабатываний.
 
ПОИСК
 
elibrary crossref neicon rusycon
 
ЮБИЛЕИ
ФОТОРЕПОРТАЖИ
 
СОБЫТИЯ
 
НОВОСТНАЯ ЛЕНТА



Авторы
Пресс-релизы
Библиотека
Конференции
Выставки
О проекте
Rambler's Top100
Телефон: +7 (915) 336-07-65 (строго: среда; пятница c 11-00 до 17-00)
  RSS
© 2003-2017 «Машины и установки: проектирование, разработка и эксплуатация» Тел.: +7 (915) 336-07-65 (строго: среда; пятница c 11-00 до 17-00)