СУЭБ ИВТ СО РАН


А.М.Федотов

Словарные статьи в коллекции: (public_cat = Thesaurus of Information Technology: Dictionary Articles )

Тезаурус РуТез

Тезаурус РуТез представляет собой лингвистический ресурс концептуального типа, то есть представляет собой иерархическую сеть понятий, к которым приписаны текстовые выражения.
Наиболее точно «жанр» тезауруса РуТез можно охарактеризовать как лингвистическая онтология для автоматической обработки текстов, то есть это онтология, большинство понятий которой вводится на основе значений реально существующих языковых выражений.

Тезаурус русского языка РуТез представляет собой иерархическую сеть понятий. Каждое понятие имеет имя, отношения с другими понятиями, набор языковых выражений – текстовых входов (слов, словосочетаний, терминов), значения которых соответствуют этому понятию. Текущий объем тезауруса РуТез - 48 тысяч понятий, 122 тысячи текстовых входов (в том числе более 65 тысяч отдельных слов).

Имя понятия – это однозначное слово, слово с пометой или словосочетание, значение которого наиболее точно отражает суть понятия и при этом в большинстве случаев реально употребляется носителями русского языка.

С одной стороны, имя понятия лишь «этикетка», а понятие описывается своим местом в сети тезауруса. С другой стороны, понятность и однозначность имени существенно облегчает анализ качества описания понятия в тезаурусе и результатов автоматической обработки текстов на основе тезаурусных знаний.

Концепция тезауруса РуТез как онтологии определяет рассмотрение слов, относящихся к разным частям речи, но выражающие один и тот же смысл (деривативы), как онтологических синонимов.

Развитие тезауруса русского языка РуТез началось с тематико-терминологического уровня, называемого Общественно-политическим тезаурусом. Общественно-политическая область описывает сферу общественной жизни современного общества и включает терминологию, относящуюся к таким сферам, как политика, экономика, военная сфера, промышленность, сельское хозяйство, социальная сфера, культура и др. При разработке Общественно-политического тезауруса проблема различия понятия и значения практически не возникала, поскольку расхождения между понятием и значением минимальны не только в терминологии, но и в тематической лексике общезначимого языка, имеющим отношения к тем профессиональным областям, которые непосредственно контактируют с повседневной жизнью населения, таким как транспорт, строительство, банки, право и многие другие До недавнего времени тезаурус РуТез использовался только как корпоративный ресурс, применяемый в таких приложениях как концептуальный информационный поиск, автоматическое расширение запроса, автоматическая рубрикация, автоматическое аннотирование, автоматическая кластеризация.

Ключевые термины, связанные с термином : "Тезаурус РуТез":

  1. Тезаурус [ru]
  2. Тезаурус WordNet [ru]
  3. Тезаурус Роже [ru]
  4. Тезаурус ЮНЕСКО [ru]
Ключевые термины публикации:  Тезаурус;   Тезаурус Wordnet;   Тезаурус Роже;   Тезаурус ЮНЕСКО;
Контекстный поиск: Задайте образец для поиска:
    

|Список терминов| |Терминдер тізімі| |Directory of Terms|
© 2013-2024, Евразийский национальный университет им. Л.Н.Гумилева, Астана
© 2007-2024, Новосибирский государственный университет, Новосибирск
© 1998-2024, Институт вычислительных технологий СО РАН, Новосибирск
© 1998-2024, Федотов А.М.
[FIT]
ФИТ НГУ       НГУ
ЕНУ им.Гумилева
ИВТ СО РАН
    Дата последней модификации: 17.03.2015