Новосибирский государственный университет

Факультет информационных технологий

Публикации и документы в коллекции "Современные проблемы информатики"

Барахнин В.Б., Ткачев Д.Н. Классификация математических документов с использованием составных ключевых терминов // Материалы Всероссийской конференции с международным участием "Знания - Онтологии - Теории" (ЗОНТ-09), Новосибирск, 22-24 октября 2009 г. Т.1. С. 16-23.

Интенсивный рост объема электронных документов делает актуальной задачуавтоматической кластеризации новых документов с целью вовлечения их в процесс научнойработы. От качества работы процесса кластеризации зависит корректность формированияцелевых групп документов на основе библиографических признаков и полнотекстовогосодержания и в конечном итоге это выливается в экономию времени научного сотрудника, которое он тратит на поиски необходимого для исследования материала. Рассматриваетсявопрос, каким образом производить выделение ключевых слов из содержательной частиэлектронного документа, выделять ли отдельные ключевые слова, либо производитьвыделение ключевых словосочетаний, относящихся к предметной области. Показано, чтоболее оптимальным алгоритмом для использования является FRiS-алгоритм, при его сравнениис жадным алгоритмом.
Ссылка на адрес в репозитарии: Классификация математических документов с использованием составных клю...
Ссылка на репозиторий DSpace: Классификация математических документов с использованием составных клю...
URL-адрес источника ресурса : Классификация математических документов с использованием составных клю...

Ссылки на авторов публикации:
Барахнин Владимир Борисович
Ткачев Д.Н.

Ключевые слова: информационные технологии; кластеризация документов; классификация документов; жадный алгоритм; Fris-функция;

Федотова Ольга Анатольевна

НГУ
ФИТ НГУ
ИВТ СО РАН

© 2007-2024, Новосибирский государственный университет, Новосибирск
© 1998-2024, Институт вычислительных технологий СО РАН, Новосибирск
© 1998-2024, Федотов А.М.
Дата последней модификации: 10.07.2015