Система Управления Электронными Библиотеками ФИЦ ИВТСтандартный вид |
О.А.Федотова |
Метод кластеризации-классификации текстов на основе бинарных классифицирующих таксонов
Чанышев Олег Георгиевич
: E51430EB
Аннотация:
Автоматический анализ естественно-языковых текстов, кластеризация. Основная цель: определение пар текстов с максимальной тематической близостью (БКТ) из заданного множества. В качестве признаковых слов выбираются доминанты, являющиеся вершинами вербальных кластеров текста. При определении пересечения признаковых слов учитываются только вершины, имеющие непустые пересечения их кластеров. На приведенном примере кластеризации 160 текстов различных предметных областей показано, что все БКТ принадлежат своим предметным областям.
Библиографическое описание
Чанышев О. Г., Метод кластеризации-классификации текстов на основе бинарных классифицирующих таксонов // Знания-Онтологии-Теории (ЗОНТ-09). - Новосибирск: Институт математики им. С.Л.Соболева СО РАН. - 2009.
Полный текст публикации (Размер файла 0.23589 Mb)
Ключевые термины публикации: кластеризация текстов; бинарные классифицирующие таксоны; кластеры слов;
Ссылки на авторов публикации:
Ваши коментарии А.М.Федотов |
Сибирское отделение |