Система Управления Электронными Библиотеками ФИЦ ИВТСтандартный вид |
О.А.Федотова |
Методы извлечения информации из текста
Ермакова Л. М.
: 6D8F6620
УДК: 025.4.03
Аннотация:
Статья представляет собой обзор существующих методов извлечения информации из текстовых данных. Извлечение информации (information extraction) – это разновидность информационного поиска, при которой из неструктурированного текста выделяется структурированная информация. Фактографический поиск – поиск фактов, соответствующих информационному запросу. Извлечение информации прежде всего связано с поиском сущностей и отношений. Это один из ключевых этапов предварительной обработки текста, необходимый для реализации более сложных моделей и программ. Базы знаний применяются для снятия омонимии, в обработке текста, семантическом поиске, вопросно-ответных системах, автоматическом понимании текста без учителя (machine reading). Сущности должны быть отнесены к некоторым категориям. Особое место в извлечении сущностей занимают проблемы идентификации именованных сущностей и кореференции (разрешение анафорических связей).
Описание документа:
Представлены существующие методы извлечения информации из текстовых данных. Рассматриваются способы извлечения сущностей и отношений. Приводится описание методов автоматического построения онтологий по корпусу, а также способы их оценки. Особое внимание уделяется техникам выделения сущностей и отношений из открытых областей, обработке именованных сущностей, а также идентификации фактов, локализованных во времени.
Библиографическое описание
Ермакова Л. М., Методы извлечения информации из текста // Вестник Пермского университета, серия Математика. Механика. Информатика. - 2012. - Выпуск № 1(9). - С. 77-84.
Полный текст публикации (Размер файла 1.730963 Mb)
Ключевые термины публикации: информационный поиск; извлечение информации; отношение; сущность; именованные сущности; временные факты;
Ссылки на авторов публикации:
Ваши коментарии А.М.Федотов |
Сибирское отделение |