![]() |
Новосибирский государственный университетФакультет информационных технологий |
![]() |
В статье описываются разработанные нами методы разделения web-страниц на содержательную и навигационную части. Данные методы основаны на выделении одинаковых частей страниц с одного сайта.Основной целью данной работы является повышение качества информационного поиска за счет удаления навигационной части из web- страниц.Мы покажем, что разработанный алгоритм позволяет эффективно разделять страницы на содержательную и навигационную части.С другой стороны, проведенный нами эксперимент по анализу эффективности информационного поиска в web на основе коллекции РОМИП-WEB-narod.ru с использованием разработанного алгоритма не привел к улучшению средней оценки точности поиска. В статье описан детальный анализ результатов информационного поиска с использованием описанного алгоритма.
Ссылка на адрес в репозитарии: Извлечение значимой информации из web-страниц для задач информационног...
Ссылка на репозиторий DSpace: Извлечение значимой информации из web-страниц для задач информационног...
URL-адрес источника ресурса : Извлечение значимой информации из web-страниц для задач информационног...
Ключевые слова: Информационный поиск; Извлечение информации;
![]() Федотова Ольга Анатольевна |
![]() НГУ ФИТ НГУ ИВТ СО РАН |