СУЭБ ИВТ СО РАН


А.М.Федотов

Словарные статьи в коллекции: (public_cat = Thesaurus of Information Technology: Dictionary Articles )

Схема данных

Схема данных - в тезаурусе – это описание структуры тезауруса, не зависимо от способа хранения, набором метаданных для установления связи между терминами и понятиями.

Тезаурус должен быть представлен в схеме, максимально приближенной к какой- либо стандартной. Он должен однозначно отображаться на другие схемы тезаурусов, быть может расширенному, для интеграции с существующими информационными системами.

Однако существует ряд тезаурусов, основная задача которых классификация ресурсов. Основными объектами таких тезаурусов (классификаторов) выступают не термины, а понятия (рубрики), и, часто, идентифицирующие их уникальные идентификаторы (коды классификации). Отношения в таком тезаурусе – характеризующие логику описываемой предметной области отношения между понятиями (рубриками).

В системах автоматического поиска тезаурусы строятся обычно по следующей схеме: для выбранной предметной области составляется словарь терминов и понятий (рубрик). Затем эти понятия объединяются в дескрипторные группы. Назначение дескрипторной группы – ввести родо-видовые (и ассоциативные) отношения между понятиями. Во главе дескрипторной группы ставится дескриптор – принятое название рассматриваемого понятия. Дескриптор одновременно выполняет роль однозначного идентификатора всей дескрипторной группы. Родо-видовые (и ассоциативные) отношения дескриптора легко встроят его в любую систему знаний. Сам дескриптор и его родо-видовые (ассоциативные) понятия попадут в тезаурус по определенной предметной области.

Схемы данных для реализации тезаурусов может быть основана на платформах, таких как RDF, XML, DTD (форматы представления тезаурусов).

Схемы данных (Schemas) являются альтернативным способом создания правил построения XML-документов. По сравнению с DTD, схемы обладают более мощными средствами для определения сложных структур данных, обеспечивают более понятный способ описания грамматики языка, способны легко модернизироваться и расширяться. Безусловным достоинством схем является также то, что они позволяют описывать правила для XML- документа средствами самого же XML.

Однако это не означает, что схемы могут полностью заменить DTD- описания - этот способ определения грамматики языка используется сейчас практическими всеми верифицирующими анализаторами XML и, более того, сами схемы, как обычные XML- элементы, тоже описываются DTD. Но серьезные возможности нового языка и его относительная простота, безусловно, дают основания утверждать, что будущий стандарт найдет широкое применение в качестве удобного и эффективного средства проверки корректности составления документов. Внешне документы схем очень похожи на те документы XML.

Именно фундаментальная логическая схема тезауруса является залогом долговременного использования и актуальности.

Литература

Основная

  1. ГОСТ 34.320-96 Информационные технологии. Система стандартов по базам данных. Концепции и терминология для концептуальной схемы и информационной базы.

Дополнительная

  1. Аджиев Алим Сапарович, Нгуен Хунг Мань Подходы к описанию и использованию тезаурусов в информационных системах // Труды 5-ой Всеросс. науч. конф. RCDL’2003, Санкт-Петербург, Россия, 2003, с.191-200.
  2. ГОСТ 34.321-96 Информационные технологии. Система стандартов по базам данных. Эталонная модель управления данными. //Межгосударственный совет по стандартизации, метрологии и сертификации, Минск, 1996 год

Контекстный поиск: Задайте образец для поиска:
    

|Список терминов| |Терминдер тізімі| |Directory of Terms|
© 2013-2024, Евразийский национальный университет им. Л.Н.Гумилева, Астана
© 2007-2024, Новосибирский государственный университет, Новосибирск
© 1998-2024, Институт вычислительных технологий СО РАН, Новосибирск
© 1998-2024, Федотов А.М.
[FIT]
ФИТ НГУ       НГУ
ЕНУ им.Гумилева
ИВТ СО РАН
    Дата последней модификации: 27.06.2015