СУЭБ ИВТ СО РАН |
А.М.Федотов |
Тезаурус ЮНЕСКО достаточно хорошо показывает структуру многоязычного тезауруса. Тезаурус предназначен для системы классификации и анализа документов на английском, французском, испанском и русском языке.Структурно оформленный список терминов, используются для тематического анализа документов и публикаций.
Семь главных предметных областей из которых состоит тезаурус с разбивкой на микротезаурусы, которые позволяют быстро ознакомиться с темой, это:
Основной целью тезауруса является:
Структура тезауруса состоит из дескрипторов и от отношении между ними. Дескрипторы, лексические единицы, характеризующие ключевой термин. (могут быть отдельные слова и словосочетания.) Порядок слов в дескрипторах, состоящих из словосочетаний, определяется, прежде всего, удобством поиска соответствующего термина. Дескрипторы выдаются по алфавиту в иерархическом порядке. Иерархия выстраивается за счет отношении.
Дескрипторы снабжены цифровыми кодами, это идентификаторы, синонимами и родственными понятиями, это отношении: эквивалентности(US/UF), иерархические(BT/NT) и ассоциативные(RT/RT), а также примечание (SN), что составляет его словарную статью. Словарная статья - это лингвистическое сопровождение, толкование единиц словаря. Один и тот же дескриптор может входить в разные фасеты и может быть вышестоящим или нижестоящим по отношению к другим дескрипторам.
Отношения между терминами установлены таким образом, что пользователи могут легко определить, что им необходимо.
Термины могут иметь следующие атрибуты:
Связи между терминами могут быть следующими:
Термины (дескрипторы) головного раздела «Коммуникации и информации» расположены в девяти лексико-семантических полях (подразделах), определяемых как головные термины:
5.05 Информационные науки
5.10 Исследования и политика в области передачи информации и связи
5.15 Управление в области информации
5.20 Информационная индустрия
5.25 Документальные информационные системы
5.30 Информационные источники
5.35 Обработка документальной информации
5.40 Информационная технология (программное обеспечение)
5.45 Информационная технология (технические средства)
Недостаток тезауруса ЮНЕСКО в том, что дальнейшее использование, как для конкретного приложения или информационной системы не достаточно, так как глубина вложений дает возможность только для классификации большими разделами, используя классификатор верхнего уровня. Недостаточно для поиска документов в более узкой специализации, например, как «сетевые технологий», так как тезаурус разбивает область на очень широкие классы и практически все документы попадают в один класс. Классы на которые разбивается тезаурус слишком велики для анализа документов для узкой предметной области, поэтому он требует уточнения. Еще одним не маловажным недостатком тезауруса является перекрестные ссылки. Пересечение между головными терминами в иерархии и на более низком уровне присутствует в одном и том же разделе и в двух разных разделах.
Тезаурус; Тезаурус Wordnet; Тезаурус РуТез; Тезаурус Роже;
© 2013-2024, Евразийский национальный университет им. Л.Н.Гумилева, Астана © 2007-2024, Новосибирский государственный университет, Новосибирск © 1998-2024, Институт вычислительных технологий СО РАН, Новосибирск © 1998-2024, Федотов А.М. |
ФИТ НГУ НГУ ЕНУ им.Гумилева ИВТ СО РАН |