Новосибирский государственный университетФакультет информационных технологий |
Интенсивный рост объема электронных документов делает актуальной задачуавтоматической кластеризации новых документов с целью вовлечения их в процесс научнойработы. От качества работы процесса кластеризации зависит корректность формированияцелевых групп документов на основе библиографических признаков и полнотекстовогосодержания и в конечном итоге это выливается в экономию времени научного сотрудника, которое он тратит на поиски необходимого для исследования материала. Рассматриваетсявопрос, каким образом производить выделение ключевых слов из содержательной частиэлектронного документа, выделять ли отдельные ключевые слова, либо производитьвыделение ключевых словосочетаний, относящихся к предметной области. Показано, чтоболее оптимальным алгоритмом для использования является FRiS-алгоритм, при его сравнениис жадным алгоритмом.
Ссылка на адрес в репозитарии: Классификация математических документов с использованием составных клю...
Ссылка на репозиторий DSpace: Классификация математических документов с использованием составных клю...
URL-адрес источника ресурса : Классификация математических документов с использованием составных клю...
Ключевые слова: информационные технологии; кластеризация документов; классификация документов; жадный алгоритм; Fris-функция;
Федотова Ольга Анатольевна |
НГУ ФИТ НГУ ИВТ СО РАН |