Базы данных ИРБИС — различия между версиями

Материал из Wikipedia
Перейти к: навигация, поиск
 
(не показано 9 промежуточных версий этого же участника)
Строка 3: Строка 3:
 
==Виды баз данных ИРБИС 64==
 
==Виды баз данных ИРБИС 64==
  
Базы данных ИРБИС 64 бывают следующих видов: [[База данных электронного каталога (вид баз данных ИРБИС)|''база данных электронного каталога'']], ''произвольная база данных'', [[База данных электронного каталога (вид баз данных ИРБИС)|''полнотекстовая база данных'']].
+
В системе ИРБИС 64 предусмотрено использование следующих типовых баз данных:
 +
* [[База данных электронного каталога (вид баз данных ИРБИС)|''база данных электронного каталога'']],
 +
* [[Полнотекстовая база данных (вид баз данных ИРБИС)|''полнотекстовая база данных'']],
 +
* базы данных, составляющие информационное обеспечение системы ИРБИС 64,
 +
а также возможно создание ''произвольной база данных''.
  
''Произвольная база данных ИРБИС'' может использоваться в качестве заготовки для создания базы данных нового вида.
+
''Базы данных электронного каталога'' и ''полнотекстовые базы данных'' соответствуют основному предназначению системы. Пользователь может создавать, и удалять эти базы данных по необходимости.
  
===Базы данных, составляющие информационное обеспечение системы ИРБИС 64===
+
Базы данных, составляющие информационное обеспечение системы ИРБИС 64, обеспечивают выполнение отдельных функций системы. Эти базы данных встроены в систему.
  
При установке системы ИРБИС создаётся ряд баз данных, составляющих информационную основу системы:
+
К базам данных, составляющим информационное обеспечение системы ИРБИС 64, относятся:
 
* База данных ''комплектования'' ('''CMPL''') - содержит предварительные (краткие) библиографические описания литературы, планируемой для приобретения, данные для заказа и подписки, реквизиты издающих, распространяющих и книготорговых организаций, сведения о поступающих партиях литературы;
 
* База данных ''комплектования'' ('''CMPL''') - содержит предварительные (краткие) библиографические описания литературы, планируемой для приобретения, данные для заказа и подписки, реквизиты издающих, распространяющих и книготорговых организаций, сведения о поступающих партиях литературы;
 
* [[Базы данных электронного каталога системы ИРБИС|База данных ''электронного каталога'']] (в общем случае таковых может быть любое количество) - содержит библиографическое и технологическое (специальное) описание литературы по фонду библиотеки;
 
* [[Базы данных электронного каталога системы ИРБИС|База данных ''электронного каталога'']] (в общем случае таковых может быть любое количество) - содержит библиографическое и технологическое (специальное) описание литературы по фонду библиотеки;
Строка 21: Строка 25:
 
* База данных издательского каталога книг ('''PODB''');
 
* База данных издательского каталога книг ('''PODB''');
 
* База данных учебного плана для задачи книгообеспеченности ('''VUZ''').
 
* База данных учебного плана для задачи книгообеспеченности ('''VUZ''').
 +
 +
''Произвольная база данных ИРБИС'' может использоваться в качестве заготовки для создания базы данных нового вида.
  
 
==База данных ИРБИС 64==
 
==База данных ИРБИС 64==
Строка 33: Строка 39:
  
 
Структура записей базы данных очень похожа на структуру записей ISO2709 за некоторым исключением: в записях ИРБИС не принято использовать повторения подполей в рамках одного поля.
 
Структура записей базы данных очень похожа на структуру записей ISO2709 за некоторым исключением: в записях ИРБИС не принято использовать повторения подполей в рамках одного поля.
 +
 +
===Словарь базы данных ИРБИС===
 +
 +
Частью структуры базы данных ИРБИС является [[Индекс базы данных ИРБИС|''индекс'' базы данных]] – средство, обеспечивающее быстрый поиск.
 +
 +
Термин ''словарь'' получил широкое распространение и фактически стал в ИРБИС-сообществе своего рода заменой понятию ''индекс'' (см. подраздел [[Индекс базы данных ИРБИС#Словарь базы данных|''Словарь базы данных'' статьи ''Индекс базы данных ИРБИС'']]).
 +
 +
Также см.:
 +
* статью [[Сценарии поиска]],
 +
* [[Рекомендации по обслуживанию баз данных ИРБИС#Настройка индекса базы данных|подраздел ''Настройка индекса базы данных'' статьи ''Рекомендации по обслуживанию баз данных ИРБИС'']].
  
 
===Технические характеристики баз данных ИРБИС===
 
===Технические характеристики баз данных ИРБИС===
Строка 80: Строка 96:
  
 
Структура и формат файлов <tt>.bkp</tt> такие же, как у файлов <tt>.mst</tt>, за исключением того, что для работы с файлом <tt>.bkp</tt> файл перекрестных ссылок не требуется, так как все записи размещаются последовательно, без пропусков.
 
Структура и формат файлов <tt>.bkp</tt> такие же, как у файлов <tt>.mst</tt>, за исключением того, что для работы с файлом <tt>.bkp</tt> файл перекрестных ссылок не требуется, так как все записи размещаются последовательно, без пропусков.
 +
 +
===Параметры и ресурсы базы данных ИРБИС===
 +
 +
Параметры и ресурсы базы данных ИРБИС это:
 +
* набор путей к файлам базы данных ИРБИС ([[#par-файл|par-файл]]);
 +
* определение ''индекса'' базы данных ([[Индекс базы данных ИРБИС#ТВП для инвертированного файла|''ТВП для инвертированного файла'']] и [[Механизм актуализации записи#Таблица актуализации|''таблица актуализации'']]);
 +
* параметрические описания и ресурсы базы данных: <tt>.fst</tt>, <tt>.ifs</tt>, <tt>.pft</tt>, <tt>.stw</tt>, <tt>.mnu</tt>, <tt>.opt</tt>, <tt>.tab</tt>, <tt>.srt</tt>, <tt>.hdr</tt>, <tt>.ws</tt>, <tt>.wss</tt>, <tt>.srw</tt>, <tt>.gbl</tt>, <tt>.tre</tt> и др.
 +
 +
====par-файл====
 +
 +
Каждой базе данных ИРБИС соответствует один <tt>.par</tt>-файл. Этот файл содержит набор путей к файлам базы данных ИРБИС.
 +
 +
Имя <tt>.par</tt>-файла соответствует имени базы данных.
 +
 +
<tt>.par</tt>-файл представляет собой текстовый файл, состоящий из 11 строк. Каждая строка представляет собой путь, указывающий местонахождение соответствующих файлов базы данных. <small>Примечание: до версии 2011.1 включительно <tt>.par</tt>-файлы включают в себя 10 строк. 11-я строка добавлена в [[Отличия ИРБИС 2012.1 от предыдущей версии|версии 2012.1]].</small>
 +
 +
В исходном состоянии системы <tt>.par</tt>-файл содержит относительные пути размещения файлов базы данных – относительно основной директории системы <tt><IRBIS_SERVER_ROOT></tt>.
 +
 +
Фактически в ИРБИС принят принцип хранения всех файлов базы данных в одной папке, поэтому <tt>.par</tt>-файлы содержат один и тот же путь, повторяющийся в каждой строке.
 +
 +
11-я строка определяет местоположение на файловой системе (путь) [[Связывание документов базы данных ИРБИС с внешними объектами#Размещение внешних объектов внутри папки соответствующей базы данных|внешних объектов, связанных по относительному пути]], а также [[Схема полнотекстовой базы данных#Виды ссылок на полные тексты|текстов в случае использования относительных ссылок в полнотекстовых баз данных]]. В случае отсутствия в <tt>.par</tt>-файле 11-й строки предполагается, что соответствующие объекты (тексты) находятся непосредственно в папке базы данных. (<small>''Примечание: в случае полнотекстовых баз данных, строго говоря, в случае отсутствия 11-й строки считается, что местонахождение текстов соответствует пути, указанному в 1-й строке <tt>.par</tt>-файла.''</small>)
 +
 +
О размещении <tt>.par</tt>-файлов см. [[Файлы ИРБИС#Размещение баз данных ИРБИС 64 на файловой системе|в подразделе ''Размещение баз данных ИРБИС 64 на файловой системе'' статьи ''Файлы ИРБИС'']].
  
 
==Система управления базами данных ИРБИС 64==
 
==Система управления базами данных ИРБИС 64==
Строка 90: Строка 129:
 
* [[Веб-ИРБИС|Веб-шлюз ИРБИС]] - доступ через Интернет.
 
* [[Веб-ИРБИС|Веб-шлюз ИРБИС]] - доступ через Интернет.
  
==Операции обслуживания баз данных ИРБИС==
+
===Интерфейс <tt>IRBIS64.dll</tt>===
 +
 
 +
Интерфейс <tt>IRBIS64.dll</tt> обеспечивает функции для работы с:
 +
* записями базы данных (чтение и запись),
 +
* инвертированным индексом.
 +
 
 +
===Язык манипулирования данными===
 +
 
 +
Для запроса и обработки данных в контексте [[#Модель баз данных ИРБИС|''записи'']] базы данных ИРБИС предназначен [[Язык форматирования системы ИРБИС|язык форматирования системы ИРБИС]].
  
 
===Блокировки===
 
===Блокировки===
Строка 107: Строка 154:
 
После завершения операции, требующей блокировки базы данных или документа, производится разблокировка. В случае сбоев при выполнении таких операций, автоматическая разблокировка в конце операции может не произойти. В этих случаях [[АРМ Администратор#Снятие блокировки|разблокировка должна быть произведена с помощью АРМ Администратор]].
 
После завершения операции, требующей блокировки базы данных или документа, производится разблокировка. В случае сбоев при выполнении таких операций, автоматическая разблокировка в конце операции может не произойти. В этих случаях [[АРМ Администратор#Снятие блокировки|разблокировка должна быть произведена с помощью АРМ Администратор]].
  
===Обслуживание словаря базы данных ИРБИС===
+
==Операции обслуживания баз данных ИРБИС==
 
 
====Создание словаря базы данных ИРБИС====
 
 
 
Создание [[#Словарь базы данных ИРБИС (инвертированный файл)|словаря]] – это создание [[Инвертированный файл|инвертированного файла]] с использованием [[Таблица выбора полей#ТВП для инвертированного файла|''ТВП для инвертированного файла'']] на основе всех ''записей'' (''документов'') базы данных.
 
 
 
В случае полнотекстовых баз данных при создании словаря из [[АРМ Администратор полнотекстовых БД#Включение текстов в полнотекстовую базу данных|включённых в базу текстовых документов]] (в процессе обработки ТВП) осуществляется извлечение текстовых данных. Извлечённые текстовые данные попадают в словарь.
 
 
 
Создание словаря [[АРМ Администратор#Создание словаря базы данных ИРБИС|осуществляется с помощью АРМ Администратор]]. Ознакомьтесь с [[Рекомендации по обслуживанию баз данных ИРБИС#Создание словаря базы данных ИРБИС|рекомендациями по созданию словаря]].
 
 
 
====Актуализация словаря базы данных ИРБИС====
 
 
 
Актуализация – это пополнение файла [[#Словарь базы данных ИРБИС (инвертированный файл)|словаря (инвертированного файла)]] на основании документов, для которых по каким-либо причинам (авария, [[Модуль глобальной корректировки базы данных|глобальная корректировка]], импорт и копирование через АРМ Администратор) не выполнялась автоматическая актуализация при их вводе/корректировке.
 
 
 
В некоторых случаях вместо актуализации выполняют создание словаря заново (о таких случаях см. [[Рекомендации по обслуживанию баз данных ИРБИС#Актуализация словаря базы данных ИРБИС|рекомендации по актуализации словаря базы данных ИРБИС]]). Такие случаи называют ''актуализация путём создания словаря''.
 
 
 
Актуализация словаря [[АРМ Администратор#Актуализация словаря базы данных ИРБИС|осуществляется с помощью АРМ Администратор]]. Ознакомьтесь с [[Рекомендации по обслуживанию баз данных ИРБИС#Актуализация словаря базы данных ИРБИС|рекомендациями по актуализации словаря]].
 
 
 
Описание механизма актуализации инвертированного файла в связи с изменением отдельной записи см. в статье [[Механизм актуализации записи]].
 
 
 
====Реорганизация словаря базы данных ИРБИС====
 
 
 
Реорганизация словаря представляет собой структурное перестроение [[#Словарь базы данных ИРБИС (инвертированный файл)|инвертированного файла]] с целью уменьшения размера файла и повышения быстродействия работы с ним.
 
 
 
Возникновение необходимости реорганизации словаря связано с тем, что в результате выполнения актуализации словаря может происходить усложнение структуры инвертированного файла и появление «пустот», которые реорганизация устраняет.
 
 
 
Реорганизация словаря [[АРМ Администратор#Реорганизация словаря базы данных ИРБИС|осуществляется с помощью АРМ Администратор]]. Ознакомьтесь с [[Рекомендации по обслуживанию баз данных ИРБИС#Реорганизация словаря базы данных ИРБИС|рекомендациями по реорганизации словаря]].
 
  
 
===Реорганизация файла документов базы данных ИРБИС===
 
===Реорганизация файла документов базы данных ИРБИС===
Строка 167: Строка 188:
 
* [[Рекомендации по обслуживанию баз данных ИРБИС]]
 
* [[Рекомендации по обслуживанию баз данных ИРБИС]]
 
* [[Структура файла документов и формат записи]]
 
* [[Структура файла документов и формат записи]]
* [[Инвертированный файл]]
+
* [[Индекс базы данных ИРБИС]]
 
* [[Таблица выбора полей]]
 
* [[Таблица выбора полей]]
 
* [[Механизм актуализации записи]]
 
* [[Механизм актуализации записи]]
 
* [[IRBIS64.dll]]
 
* [[IRBIS64.dll]]
 
* [[TCP/IP сервер ИРБИС 64]]
 
* [[TCP/IP сервер ИРБИС 64]]
 +
* [[Сценарии поиска]]
 +
* [[Язык форматирования системы ИРБИС]]
  
 
Источники информации:
 
Источники информации:

Текущая версия на 20:01, 9 апреля 2015

Базы данных ИРБИС разработаны для использования программным обеспечением ИРБИС.

Виды баз данных ИРБИС 64

В системе ИРБИС 64 предусмотрено использование следующих типовых баз данных:

а также возможно создание произвольной база данных.

Базы данных электронного каталога и полнотекстовые базы данных соответствуют основному предназначению системы. Пользователь может создавать, и удалять эти базы данных по необходимости.

Базы данных, составляющие информационное обеспечение системы ИРБИС 64, обеспечивают выполнение отдельных функций системы. Эти базы данных встроены в систему.

К базам данных, составляющим информационное обеспечение системы ИРБИС 64, относятся:

  • База данных комплектования (CMPL) - содержит предварительные (краткие) библиографические описания литературы, планируемой для приобретения, данные для заказа и подписки, реквизиты издающих, распространяющих и книготорговых организаций, сведения о поступающих партиях литературы;
  • База данных электронного каталога (в общем случае таковых может быть любое количество) - содержит библиографическое и технологическое (специальное) описание литературы по фонду библиотеки;
  • База данных читателей (RDR) - содержит реквизиты зарегистрированных читателей и сведения о выдаче/возврате литературы;
  • База данных заказов (RQST) - содержит очередь текущих заказов на выдачу литературы и записи бронирования;
  • Системная база данных (HELP) - содержит основной Тематический классификатор системы (Рубрикатор ГРНТИ);
  • Базы данных авторитетных файлов «Коллективные авторы» (ATHRC), «Индивидуальные авторы» (ATHRA), «Предметные заголовки» (ATHRS), алфавитно-предметного указателя к УДК (ATHRU) и алфавитно-предметного указателя к ББК (ATHRB);
  • Базы данных УДК (RSUDC) и ББК (RSBBK);
  • Базы данных, являющиеся реализациями идеи тезауруса: TEZ, URUB, MESH;
  • База данных подписного каталога периодических изданий (POST);
  • База данных издательского каталога книг (PODB);
  • База данных учебного плана для задачи книгообеспеченности (VUZ).

Произвольная база данных ИРБИС может использоваться в качестве заготовки для создания базы данных нового вида.

База данных ИРБИС 64

Модель баз данных ИРБИС

Базы данных ИРБИС по своей модели относятся к иерархическим базам данных.

База данных представляет собой двухуровневое дерево: последовательность записей (также говорят документов), где каждая запись (каждый документ) состоит из последовательности полей, обозначенных числовыми метками.

Поле может иметь внутреннюю структуру – состоять из подполей. Каждой структурной единице поля, т.е. подполю, предшествуют два символа-разделителя, первым из которых является символ ^.

Структура записей базы данных очень похожа на структуру записей ISO2709 за некоторым исключением: в записях ИРБИС не принято использовать повторения подполей в рамках одного поля.

Словарь базы данных ИРБИС

Частью структуры базы данных ИРБИС является индекс базы данных – средство, обеспечивающее быстрый поиск.

Термин словарь получил широкое распространение и фактически стал в ИРБИС-сообществе своего рода заменой понятию индекс (см. подраздел Словарь базы данных статьи Индекс базы данных ИРБИС).

Также см.:

Технические характеристики баз данных ИРБИС

Во многом в ИРБИС 64 унаследована идеология системы CDS/ISIS. По сравнению с CDS/ISIS, ограничения на размер записи, номер поля, количество повторений полей, количество записей, размер базы данных, расширены до пределов, преодоление которых в ближайшем будущем маловероятно.

Для хранения данных в базах ИРБИС 64 используется кодировка UTF-8.

Некоторые общие технические характеристики баз данных ИРБИС 64:

Характеристика Значение
Максимальное количество записей в БД 4 294 967 296
Максимальный размер MST-файла 4 Тб
Максимальный размер файлов n01, l01, ifp 4 Тб
Максимальный размер одной записи 4 Тб
Максимальное количество повторений одного поля 65 535

Файловая структура базы данных ИРБИС

Файл документов базы данных ИРБИС

Файл с данными, представляющими собой основное содержимое базы данных в первичном виде.

Для файлов документов баз данных ИРБИС используется расширение .mst.

Существует также понятие файла документов базы данных ИРБИС как логического файла, состоящего из двух файлов: с расширениями .mst и .xrf.

О структуре и формате файлов документов см. статью Структура файла документов и формат записи.

Словарь базы данных ИРБИС (инвертированный файл)

Словарь представляет собой индекс базы данных (структура, обеспечивающая поиск в базе данных).

Словарь хранится в трёх файлах: с расширениями .ifp, .n01 и .l01.

Подробности см. в статье Индекс базы данных ИРБИС.

Резервная копия файла документов базы данных ИРБИС

Для резервных копий файлов документов баз данных ИРБИС используется расширение .bkp.

Структура и формат файлов .bkp такие же, как у файлов .mst, за исключением того, что для работы с файлом .bkp файл перекрестных ссылок не требуется, так как все записи размещаются последовательно, без пропусков.

Параметры и ресурсы базы данных ИРБИС

Параметры и ресурсы базы данных ИРБИС это:

par-файл

Каждой базе данных ИРБИС соответствует один .par-файл. Этот файл содержит набор путей к файлам базы данных ИРБИС.

Имя .par-файла соответствует имени базы данных.

.par-файл представляет собой текстовый файл, состоящий из 11 строк. Каждая строка представляет собой путь, указывающий местонахождение соответствующих файлов базы данных. Примечание: до версии 2011.1 включительно .par-файлы включают в себя 10 строк. 11-я строка добавлена в версии 2012.1.

В исходном состоянии системы .par-файл содержит относительные пути размещения файлов базы данных – относительно основной директории системы <IRBIS_SERVER_ROOT>.

Фактически в ИРБИС принят принцип хранения всех файлов базы данных в одной папке, поэтому .par-файлы содержат один и тот же путь, повторяющийся в каждой строке.

11-я строка определяет местоположение на файловой системе (путь) внешних объектов, связанных по относительному пути, а также текстов в случае использования относительных ссылок в полнотекстовых баз данных. В случае отсутствия в .par-файле 11-й строки предполагается, что соответствующие объекты (тексты) находятся непосредственно в папке базы данных. (Примечание: в случае полнотекстовых баз данных, строго говоря, в случае отсутствия 11-й строки считается, что местонахождение текстов соответствует пути, указанному в 1-й строке .par-файла.)

О размещении .par-файлов см. в подразделе Размещение баз данных ИРБИС 64 на файловой системе статьи Файлы ИРБИС.

Система управления базами данных ИРБИС 64

Для администраторов баз данных предназначен модуль АРМ Администратор.

Программный доступ к базам данных ИРБИС обеспечивают:

Интерфейс IRBIS64.dll

Интерфейс IRBIS64.dll обеспечивает функции для работы с:

  • записями базы данных (чтение и запись),
  • инвертированным индексом.

Язык манипулирования данными

Для запроса и обработки данных в контексте записи базы данных ИРБИС предназначен язык форматирования системы ИРБИС.

Блокировки

Виды блокировок:

  • монопольная блокировка базы данных в целом;
  • блокировка документа в базе данных.

Операции, требующие монопольной блокировки базы данных в целом:

  • реорганизация файла документов;
  • создание словаря;
  • реорганизация словаря;
  • создание резервной копии файла документов;
  • восстановление файла документов из резервной копии.

После завершения операции, требующей блокировки базы данных или документа, производится разблокировка. В случае сбоев при выполнении таких операций, автоматическая разблокировка в конце операции может не произойти. В этих случаях разблокировка должна быть произведена с помощью АРМ Администратор.

Операции обслуживания баз данных ИРБИС

Реорганизация файла документов базы данных ИРБИС

Реорганизация файла документов базы данных ИРБИС предназначена для уменьшения размера файла документов.

Уменьшение размера файла достигается за счёт того, что:

  • логически удалённые документы удаляются физически;
  • для каждого документа сохраняется только последняя копия документа, все старые копии удаляются.

Примечание: при каждой корректировке документа в файл документов добавляется новая скорректированная копия данного документа, при этом предыдущие версии документа сохраняются, именно эти старые версии удаляются при реорганизации файла документов.

Реорганизация файла документов представляет собой последовательное выполнение операций резервного копирования файла документов и восстановления файла документов из резервной копии.

Реорганизация файла документов осуществляется с помощью АРМ Администратор. Ознакомьтесь с рекомендациями по реорганизации файла документов.

Резервное копирование файла документов базы данных ИРБИС

Резервное копирование файла документов – процесс создания резервной копии файла документов, предназначенной для восстановления базы данных в случае её повреждения или разрушения.

В результате выполнения операции резервного копирования в файл резервной копии попадают:

  • только последние копии всех документов (все старые копии документов не попадают в файл резервной копии);
  • следует отметить особо, что логически удалённые документы попадают в файл резервной копии.

В результате выполнения операции восстановления базы данных из резервной копии в базу попадают:

  • все записи, кроме логически удалённых (логически удалённые записи, содержащиеся в резервной копии, в базу не попадают).

Резервное копирование в системе ИРБИС рекомендуется осуществлять с помощью АРМ Администратор. Ознакомьтесь с рекомендациями по резервному копированию баз данных ИРБИС.

Ссылки

См. также:

Источники информации: