Базы данных ИРБИС — различия между версиями

Материал из Wikipedia
Перейти к: навигация, поиск
(Ссылки)
 
(не показаны 3 промежуточные версии этого же участника)
Строка 46: Строка 46:
 
Термин ''словарь'' получил широкое распространение и фактически стал в ИРБИС-сообществе своего рода заменой понятию ''индекс'' (см. подраздел [[Индекс базы данных ИРБИС#Словарь базы данных|''Словарь базы данных'' статьи ''Индекс базы данных ИРБИС'']]).
 
Термин ''словарь'' получил широкое распространение и фактически стал в ИРБИС-сообществе своего рода заменой понятию ''индекс'' (см. подраздел [[Индекс базы данных ИРБИС#Словарь базы данных|''Словарь базы данных'' статьи ''Индекс базы данных ИРБИС'']]).
  
Также см. статью [[Сценарии поиска]].
+
Также см.:
 +
* статью [[Сценарии поиска]],
 +
* [[Рекомендации по обслуживанию баз данных ИРБИС#Настройка индекса базы данных|подраздел ''Настройка индекса базы данных'' статьи ''Рекомендации по обслуживанию баз данных ИРБИС'']].
  
 
===Технические характеристики баз данных ИРБИС===
 
===Технические характеристики баз данных ИРБИС===
Строка 94: Строка 96:
  
 
Структура и формат файлов <tt>.bkp</tt> такие же, как у файлов <tt>.mst</tt>, за исключением того, что для работы с файлом <tt>.bkp</tt> файл перекрестных ссылок не требуется, так как все записи размещаются последовательно, без пропусков.
 
Структура и формат файлов <tt>.bkp</tt> такие же, как у файлов <tt>.mst</tt>, за исключением того, что для работы с файлом <tt>.bkp</tt> файл перекрестных ссылок не требуется, так как все записи размещаются последовательно, без пропусков.
 +
 +
===Параметры и ресурсы базы данных ИРБИС===
 +
 +
Параметры и ресурсы базы данных ИРБИС это:
 +
* набор путей к файлам базы данных ИРБИС ([[#par-файл|par-файл]]);
 +
* определение ''индекса'' базы данных ([[Индекс базы данных ИРБИС#ТВП для инвертированного файла|''ТВП для инвертированного файла'']] и [[Механизм актуализации записи#Таблица актуализации|''таблица актуализации'']]);
 +
* параметрические описания и ресурсы базы данных: <tt>.fst</tt>, <tt>.ifs</tt>, <tt>.pft</tt>, <tt>.stw</tt>, <tt>.mnu</tt>, <tt>.opt</tt>, <tt>.tab</tt>, <tt>.srt</tt>, <tt>.hdr</tt>, <tt>.ws</tt>, <tt>.wss</tt>, <tt>.srw</tt>, <tt>.gbl</tt>, <tt>.tre</tt> и др.
 +
 +
====par-файл====
 +
 +
Каждой базе данных ИРБИС соответствует один <tt>.par</tt>-файл. Этот файл содержит набор путей к файлам базы данных ИРБИС.
 +
 +
Имя <tt>.par</tt>-файла соответствует имени базы данных.
 +
 +
<tt>.par</tt>-файл представляет собой текстовый файл, состоящий из 11 строк. Каждая строка представляет собой путь, указывающий местонахождение соответствующих файлов базы данных. <small>Примечание: до версии 2011.1 включительно <tt>.par</tt>-файлы включают в себя 10 строк. 11-я строка добавлена в [[Отличия ИРБИС 2012.1 от предыдущей версии|версии 2012.1]].</small>
 +
 +
В исходном состоянии системы <tt>.par</tt>-файл содержит относительные пути размещения файлов базы данных – относительно основной директории системы <tt><IRBIS_SERVER_ROOT></tt>.
 +
 +
Фактически в ИРБИС принят принцип хранения всех файлов базы данных в одной папке, поэтому <tt>.par</tt>-файлы содержат один и тот же путь, повторяющийся в каждой строке.
 +
 +
11-я строка определяет местоположение на файловой системе (путь) [[Связывание документов базы данных ИРБИС с внешними объектами#Размещение внешних объектов внутри папки соответствующей базы данных|внешних объектов, связанных по относительному пути]], а также [[Схема полнотекстовой базы данных#Виды ссылок на полные тексты|текстов в случае использования относительных ссылок в полнотекстовых баз данных]]. В случае отсутствия в <tt>.par</tt>-файле 11-й строки предполагается, что соответствующие объекты (тексты) находятся непосредственно в папке базы данных. (<small>''Примечание: в случае полнотекстовых баз данных, строго говоря, в случае отсутствия 11-й строки считается, что местонахождение текстов соответствует пути, указанному в 1-й строке <tt>.par</tt>-файла.''</small>)
 +
 +
О размещении <tt>.par</tt>-файлов см. [[Файлы ИРБИС#Размещение баз данных ИРБИС 64 на файловой системе|в подразделе ''Размещение баз данных ИРБИС 64 на файловой системе'' статьи ''Файлы ИРБИС'']].
  
 
==Система управления базами данных ИРБИС 64==
 
==Система управления базами данных ИРБИС 64==
Строка 110: Строка 135:
 
* инвертированным индексом.
 
* инвертированным индексом.
  
===Язык форматирования===
+
===Язык манипулирования данными===
  
Язык форматирования ИРБИС – язык манипулирования данными в контексте [[#Модель баз данных ИРБИС|''записи'']] базы данных, представляет собой средство, с помощью которого осуществляется разнообразное представление данных для многих операций и функций системы, в частности, для показа и печати документов, для создания словарей, для импорта/экспорта данных, для формально-логического контроля и т.д.
+
Для запроса и обработки данных в контексте [[#Модель баз данных ИРБИС|''записи'']] базы данных ИРБИС предназначен [[Язык форматирования системы ИРБИС|язык форматирования системы ИРБИС]].
  
 
===Блокировки===
 
===Блокировки===
Строка 169: Строка 194:
 
* [[TCP/IP сервер ИРБИС 64]]
 
* [[TCP/IP сервер ИРБИС 64]]
 
* [[Сценарии поиска]]
 
* [[Сценарии поиска]]
* [[Язык форматирования]]
+
* [[Язык форматирования системы ИРБИС]]
  
 
Источники информации:
 
Источники информации:

Текущая версия на 20:01, 9 апреля 2015

Базы данных ИРБИС разработаны для использования программным обеспечением ИРБИС.

Виды баз данных ИРБИС 64

В системе ИРБИС 64 предусмотрено использование следующих типовых баз данных:

а также возможно создание произвольной база данных.

Базы данных электронного каталога и полнотекстовые базы данных соответствуют основному предназначению системы. Пользователь может создавать, и удалять эти базы данных по необходимости.

Базы данных, составляющие информационное обеспечение системы ИРБИС 64, обеспечивают выполнение отдельных функций системы. Эти базы данных встроены в систему.

К базам данных, составляющим информационное обеспечение системы ИРБИС 64, относятся:

  • База данных комплектования (CMPL) - содержит предварительные (краткие) библиографические описания литературы, планируемой для приобретения, данные для заказа и подписки, реквизиты издающих, распространяющих и книготорговых организаций, сведения о поступающих партиях литературы;
  • База данных электронного каталога (в общем случае таковых может быть любое количество) - содержит библиографическое и технологическое (специальное) описание литературы по фонду библиотеки;
  • База данных читателей (RDR) - содержит реквизиты зарегистрированных читателей и сведения о выдаче/возврате литературы;
  • База данных заказов (RQST) - содержит очередь текущих заказов на выдачу литературы и записи бронирования;
  • Системная база данных (HELP) - содержит основной Тематический классификатор системы (Рубрикатор ГРНТИ);
  • Базы данных авторитетных файлов «Коллективные авторы» (ATHRC), «Индивидуальные авторы» (ATHRA), «Предметные заголовки» (ATHRS), алфавитно-предметного указателя к УДК (ATHRU) и алфавитно-предметного указателя к ББК (ATHRB);
  • Базы данных УДК (RSUDC) и ББК (RSBBK);
  • Базы данных, являющиеся реализациями идеи тезауруса: TEZ, URUB, MESH;
  • База данных подписного каталога периодических изданий (POST);
  • База данных издательского каталога книг (PODB);
  • База данных учебного плана для задачи книгообеспеченности (VUZ).

Произвольная база данных ИРБИС может использоваться в качестве заготовки для создания базы данных нового вида.

База данных ИРБИС 64

Модель баз данных ИРБИС

Базы данных ИРБИС по своей модели относятся к иерархическим базам данных.

База данных представляет собой двухуровневое дерево: последовательность записей (также говорят документов), где каждая запись (каждый документ) состоит из последовательности полей, обозначенных числовыми метками.

Поле может иметь внутреннюю структуру – состоять из подполей. Каждой структурной единице поля, т.е. подполю, предшествуют два символа-разделителя, первым из которых является символ ^.

Структура записей базы данных очень похожа на структуру записей ISO2709 за некоторым исключением: в записях ИРБИС не принято использовать повторения подполей в рамках одного поля.

Словарь базы данных ИРБИС

Частью структуры базы данных ИРБИС является индекс базы данных – средство, обеспечивающее быстрый поиск.

Термин словарь получил широкое распространение и фактически стал в ИРБИС-сообществе своего рода заменой понятию индекс (см. подраздел Словарь базы данных статьи Индекс базы данных ИРБИС).

Также см.:

Технические характеристики баз данных ИРБИС

Во многом в ИРБИС 64 унаследована идеология системы CDS/ISIS. По сравнению с CDS/ISIS, ограничения на размер записи, номер поля, количество повторений полей, количество записей, размер базы данных, расширены до пределов, преодоление которых в ближайшем будущем маловероятно.

Для хранения данных в базах ИРБИС 64 используется кодировка UTF-8.

Некоторые общие технические характеристики баз данных ИРБИС 64:

Характеристика Значение
Максимальное количество записей в БД 4 294 967 296
Максимальный размер MST-файла 4 Тб
Максимальный размер файлов n01, l01, ifp 4 Тб
Максимальный размер одной записи 4 Тб
Максимальное количество повторений одного поля 65 535

Файловая структура базы данных ИРБИС

Файл документов базы данных ИРБИС

Файл с данными, представляющими собой основное содержимое базы данных в первичном виде.

Для файлов документов баз данных ИРБИС используется расширение .mst.

Существует также понятие файла документов базы данных ИРБИС как логического файла, состоящего из двух файлов: с расширениями .mst и .xrf.

О структуре и формате файлов документов см. статью Структура файла документов и формат записи.

Словарь базы данных ИРБИС (инвертированный файл)

Словарь представляет собой индекс базы данных (структура, обеспечивающая поиск в базе данных).

Словарь хранится в трёх файлах: с расширениями .ifp, .n01 и .l01.

Подробности см. в статье Индекс базы данных ИРБИС.

Резервная копия файла документов базы данных ИРБИС

Для резервных копий файлов документов баз данных ИРБИС используется расширение .bkp.

Структура и формат файлов .bkp такие же, как у файлов .mst, за исключением того, что для работы с файлом .bkp файл перекрестных ссылок не требуется, так как все записи размещаются последовательно, без пропусков.

Параметры и ресурсы базы данных ИРБИС

Параметры и ресурсы базы данных ИРБИС это:

par-файл

Каждой базе данных ИРБИС соответствует один .par-файл. Этот файл содержит набор путей к файлам базы данных ИРБИС.

Имя .par-файла соответствует имени базы данных.

.par-файл представляет собой текстовый файл, состоящий из 11 строк. Каждая строка представляет собой путь, указывающий местонахождение соответствующих файлов базы данных. Примечание: до версии 2011.1 включительно .par-файлы включают в себя 10 строк. 11-я строка добавлена в версии 2012.1.

В исходном состоянии системы .par-файл содержит относительные пути размещения файлов базы данных – относительно основной директории системы <IRBIS_SERVER_ROOT>.

Фактически в ИРБИС принят принцип хранения всех файлов базы данных в одной папке, поэтому .par-файлы содержат один и тот же путь, повторяющийся в каждой строке.

11-я строка определяет местоположение на файловой системе (путь) внешних объектов, связанных по относительному пути, а также текстов в случае использования относительных ссылок в полнотекстовых баз данных. В случае отсутствия в .par-файле 11-й строки предполагается, что соответствующие объекты (тексты) находятся непосредственно в папке базы данных. (Примечание: в случае полнотекстовых баз данных, строго говоря, в случае отсутствия 11-й строки считается, что местонахождение текстов соответствует пути, указанному в 1-й строке .par-файла.)

О размещении .par-файлов см. в подразделе Размещение баз данных ИРБИС 64 на файловой системе статьи Файлы ИРБИС.

Система управления базами данных ИРБИС 64

Для администраторов баз данных предназначен модуль АРМ Администратор.

Программный доступ к базам данных ИРБИС обеспечивают:

Интерфейс IRBIS64.dll

Интерфейс IRBIS64.dll обеспечивает функции для работы с:

  • записями базы данных (чтение и запись),
  • инвертированным индексом.

Язык манипулирования данными

Для запроса и обработки данных в контексте записи базы данных ИРБИС предназначен язык форматирования системы ИРБИС.

Блокировки

Виды блокировок:

  • монопольная блокировка базы данных в целом;
  • блокировка документа в базе данных.

Операции, требующие монопольной блокировки базы данных в целом:

  • реорганизация файла документов;
  • создание словаря;
  • реорганизация словаря;
  • создание резервной копии файла документов;
  • восстановление файла документов из резервной копии.

После завершения операции, требующей блокировки базы данных или документа, производится разблокировка. В случае сбоев при выполнении таких операций, автоматическая разблокировка в конце операции может не произойти. В этих случаях разблокировка должна быть произведена с помощью АРМ Администратор.

Операции обслуживания баз данных ИРБИС

Реорганизация файла документов базы данных ИРБИС

Реорганизация файла документов базы данных ИРБИС предназначена для уменьшения размера файла документов.

Уменьшение размера файла достигается за счёт того, что:

  • логически удалённые документы удаляются физически;
  • для каждого документа сохраняется только последняя копия документа, все старые копии удаляются.

Примечание: при каждой корректировке документа в файл документов добавляется новая скорректированная копия данного документа, при этом предыдущие версии документа сохраняются, именно эти старые версии удаляются при реорганизации файла документов.

Реорганизация файла документов представляет собой последовательное выполнение операций резервного копирования файла документов и восстановления файла документов из резервной копии.

Реорганизация файла документов осуществляется с помощью АРМ Администратор. Ознакомьтесь с рекомендациями по реорганизации файла документов.

Резервное копирование файла документов базы данных ИРБИС

Резервное копирование файла документов – процесс создания резервной копии файла документов, предназначенной для восстановления базы данных в случае её повреждения или разрушения.

В результате выполнения операции резервного копирования в файл резервной копии попадают:

  • только последние копии всех документов (все старые копии документов не попадают в файл резервной копии);
  • следует отметить особо, что логически удалённые документы попадают в файл резервной копии.

В результате выполнения операции восстановления базы данных из резервной копии в базу попадают:

  • все записи, кроме логически удалённых (логически удалённые записи, содержащиеся в резервной копии, в базу не попадают).

Резервное копирование в системе ИРБИС рекомендуется осуществлять с помощью АРМ Администратор. Ознакомьтесь с рекомендациями по резервному копированию баз данных ИРБИС.

Ссылки

См. также:

Источники информации: