Установка и использование ИРБИС 64 для полнотекстовых баз данных
Содержание
- 1 Рекомендации по установке
- 2 Рекомендации по использованию и настройке
- 2.1 Рекомендации по созданию полнотекстовой базы данных
- 2.2 Типовые действия администратора при формировании полнотекстовой базы
- 2.3 Организация доступа пользователей к полнотекстовым базам с помощью АРМ Читатель полнотекстовых БД
- 2.4 Организация доступа пользователей к полнотекстовым базам через веб-браузер с помощью веб-шлюза ИРБИС
- 2.4.1 Использование относительных ссылок и организация доступа пользователей к полнотекстовым базам через веб-браузер с помощью веб-шлюза ИРБИС
- 2.4.2 Использование абсолютных ссылок и организация доступа пользователей к полнотекстовым базам через веб-браузер с помощью веб-шлюза ИРБИС
- 2.4.3 Использование URL и организация доступа пользователей к полнотекстовым базам через веб-браузер с помощью веб-шлюза ИРБИС
- 2.5 Включение текстов из электронного каталога с относительными ссылками
- 2.6 Преобразование ссылок с помощью глобальной корректировки
- 2.7 Требования и рекомендации по отношению к текстовым документам, включаемым в полнотекстовую базу
- 3 Рецепты работы с полнотекстовыми базами данных ИРБИС
- 4 Ссылки
Рекомендации по установке
Установочный пакет Полнотекстовые базы данных ИРБИС 64
Для установки АРМ Администратор полнотекстовых БД и АРМ Читатель для полнотекстовых БД предназначен установочный пакет Полнотекстовые базы данных ИРБИС 64 (файл setup64_FullText.exe).
Окно установщика Полнотекстовые базы данных ИРБИС 64:
Примечание: при появлении в процессе установки сообщения "При регистрации dll библиотеки произошла ошибка. Необходимо в ручном режиме зарегистрировать dll библиотеку ...\doc2text.dll" воспользуйтесь инструкцией Регистрация библиотеки docs2text.dll с помощью инструмента Windows Regsvr32.exe.
Установка ИРБИС 64 для полнотекстовых баз данных в одну папку с обычным ИРБИС 64
Возможна установка ИРБИС 64 для полнотекстовых баз данных в одну папку с серверной частью ИРБИС 64.
Этот вариант установки полезен тем, что обеспечивает возможность воспользоваться инструментами обычного ИРБИС по отношению к полнотекстовым базам данных. Например, полезной бывает возможность редактировать полнотекстовую базу данных с помощью АРМ Каталогизатор.
Установка Веб-шлюза ИРБИС для полнотекстовых баз данных
Установка Веб-шлюза ИРБИС для полнотекстовых баз данных осуществляется отдельным установщиком. См. статью Установка Веб-шлюза Ирбис 64.
Регистрация библиотеки docs2text.dll с помощью инструмента Windows Regsvr32.exe
Регистрация библиотеки docs2text.dll выполняется автоматически в процессе установки пакета Полнотекстовые базы данных ИРБИС 64.
Иногда возникает необходимость зарегистрировать библиотеку docs2text.dll в "ручном режиме" с помощью инструмента Windows Regsvr32.exe. Для этого достаточно выполнить следующую последовательность шагов:
- В командной строке установить текущей папку, в которой находится файл docs2text.dll (это папка, в которую установлена серверная часть ИРБИС).
- Выполнить команду regsvr32 docs2text.dll:
- Убедиться, что команда выполнена успешно. Команда выполнена успешно, если получено соответствующее сообщение:
Рекомендации по использованию и настройке
Рекомендации по созданию полнотекстовой базы данных
Типовые действия администратора при формировании полнотекстовой базы осуществляется очень просто, как описано в подразделе Типовые действия администратора при формировании полнотекстовой базы данной статьи.
При этом администратор ИРБИС должен понимать взаимосвязь вопросов размещения полнотекстовых документов, выбора в ИРБИС вида ссылок на полные тексты, а также доступа пользователей к полным текстам через АРМ Читатель полнотекстовых БД и через веб-браузер с помощью веб-шлюза ИРБИС. Эта взаимосвязь описывается в следующих подразделах данной статьи: Организация доступа пользователей к полнотекстовым базам с помощью АРМ Читатель полнотекстовых БД и Организация доступа пользователей к полнотекстовым базам через веб-браузер с помощью веб-шлюза ИРБИС.
Типовые действия администратора при формировании полнотекстовой базы
При формировании полнотекстовой базы данных администратор баз данных ИРБИС выполняет следующие действия:
- Выбор существующей или создание новой полнотекстовой базы данных.
- Добавление текстов в базу данных или удаление текстов из базы.
- Актуализация или создание словаря базы данных (рекомендуется ознакомиться с особенностями обслуживания словаря полнотекстовых баз данных).
Организация доступа пользователей к полнотекстовым базам с помощью АРМ Читатель полнотекстовых БД
АРМ Читатель полнотекстовых БД обеспечивает доступ пользователей к коллекциям полнотекстовых документов в компьютерной сети с использованием файлового доступа.
Для организации функционирования АРМ Читатель полнотекстовых БД на нескольких компьютерах в сети, необходимо:
- установить АРМ Читатель для полнотекстовых БД на одном из компьютеров;
- открыть сетевой доступ к папке, в которой установлен данный АРМ Читатель для полнотекстовых БД;
- из открытой папки осуществлять запуск АРМ Читатель для полнотекстовых БД.
При этом размещение файлов полных текстов возможно:
- в папке базы данных или
- в любой папке, к которой открыт сетевой доступ.
При размещении файлов полных текстов в папке базы данных, тексты могут быть включены в полнотекстовую базу данных с использованием относительных путей.
При размещении файлов полных текстов в папке с открытым сетевым доступом, тексты могут быть включены в полнотекстовую базу данных с использованием полных путей.
Примечание: разработчики ИРБИС рекомендуют размещать тексты в папке базы данных и включать их в базу данных с использованием относительных путей.
Ссылки на обсуждения по данной теме на форуме ИРБИС:
Организация доступа пользователей к полнотекстовым базам через веб-браузер с помощью веб-шлюза ИРБИС
Веб-шлюз ИРБИС для полнотекстовых баз данных обеспечивает доступ пользователей к коллекциям полнотекстовых документов через веб-браузер.
Если планируется использовать полнотекстовые базы через Веб, имеет значение вопрос выбора, какие будут использоваться ссылки на полные тексты, относительные или абсолютные. Для этих двух вариантов существует разница в технической реализации и необходимых настройках системы.
Использование относительных ссылок и организация доступа пользователей к полнотекстовым базам через веб-браузер с помощью веб-шлюза ИРБИС
Рекомендуется использовать относительные ссылки по той причине, что в этом случае дополнительных настроек не требуется.
Особенности выбора относительных ссылок:
- Тексты располагаются в папке базы данных.
- Возможно включение текстов в полнотекстовую базу с помощью АРМ Администратор полнотекстовых БД через диалоговое окно обзора папок и файлов.
- При включении текстов в полнотекстовую базу с помощью АРМ Администратор полнотекстовых БД путём импорта из электронного каталога администратор ИРБИС должен самостоятельно выполнить действия, описанные в подразделе Включение текстов из электронного каталога с относительными ссылками данной статьи.
- Тексты доступны пользователю опосредовано через Веб-шлюз ИРБИС, их URL представляют собой ссылки на Веб-шлюз ИРБИС с соответствующими командами для получения полного текста.
Использование абсолютных ссылок и организация доступа пользователей к полнотекстовым базам через веб-браузер с помощью веб-шлюза ИРБИС
Тексты добавляются в полнотекстовую базу с помощью АРМ Администратор полнотекстовых БД через диалоговое окно обзора папок и файлов.
При использовании абсолютных ссылок и организация доступа пользователей к полнотекстовым базам через веб-браузер с помощью веб-шлюза ИРБИС возможна при соблюдении следующих условий:
- Полнотекстовые документы должны быть доступны на веб или FTP сервере.
- Возможно преобразование абсолютных ссылок в URL путём замены начала ссылки.
- Чтобы это преобразование происходило, должна быть произведена настройка:
- В файле irbis_server.ini, который был создан при инсталляции в папке Веб-сервера для Веб-шлюза ИРБИС, в секции MAIN задать параметры (приведен пример значений параметров):
FullTextPathDbn=\\Alio1\irbiswrk\lusia\PDF_text\ FullTextPathWeb=ftp:\\ftp.gpntb.ru\pub\irbis\
- В первом параметре следует указать сетевой путь на тексты, которые располагались по этому пути при их добавлении, в примере это - \\Alio1\irbiswrk\lusia\PDF_text\. Во втором параметре следует указать часть URL текстов (до их названия) их расположения. В примере это - ftp:\\ftp.gpntb.ru\pub\irbis\.
- В формате BRIEFHTML_ft.pft имеется вставка (если нет, добавить), которая замещает в адресе текста (в подполе 952^B) путь на файл при создании на URL местоположения текста. Часть формата:
/* возможность замены формата через параметры irbis_server.ini из cgi if &uf('IMAIN,FullTextPathDbn,')<>'' and &uf('IMAIN,FullTextPathWeb,')<>'' then &uf('+7W10#',&uf('+9I?',,&uf('IMAIN,FullTextPathDbn,'),,'?#',,&uf('IMAIN,FullTextPathWeb,'),,'#',v952^B)), '<a style="border:0px;font-size:12px;" target=_blank href="',G10, else /*
Особенности выбора относительных ссылок:
- Тексты доступны в локальной сети.
- Возможно включение текстов в полнотекстовую базу с помощью АРМ Администратор полнотекстовых БД через диалоговое окно обзора папок и файлов.
- Возможно включение текстов в полнотекстовую базу с помощью АРМ Администратор полнотекстовых БД путём импорта из электронного каталога.
- Тексты доступны пользователю через Веб по URL, получающимся путём преобразования, определяемого параметрами irbis_server.ini, как описано выше.
Использование URL и организация доступа пользователей к полнотекстовым базам через веб-браузер с помощью веб-шлюза ИРБИС
В этом случае дополнительных настроек не требуется.
Особенности выбора URL ссылок:
- Возможно включение текстов в полнотекстовую базу с помощью АРМ Администратор полнотекстовых БД путём импорта из электронного каталога.
- Нет возможности группового включения текстов с URL в полнотекстовую базу. Исключение составляют те случаи, когда возможно включение текстов в два этапа, как описано в подразделе Преобразование ссылок с помощью глобальной корректировки данной статьи.
- Тексты доступны пользователю через Веб по URL, указанному для каждого текста.
Включение текстов из электронного каталога с относительными ссылками
Даже в случае использования в исходном электронном каталоге относительных ссылок, в полнотекстовую базу будут добавлены абсолютные ссылки на тексты – полные пути к текстовым файлам, находящимся в папке базы данных исходного электронного каталога. Это абсолютные пути, начинающиеся с буквы диска, не соответствующие UNC.
Возможно преобразование этих абсолютных ссылок в относительные ссылки с помощью глобальной корректировки, как описано в подразделе Преобразование ссылок с помощью глобальной корректировки данной статьи. При этом необходимо скопировать текстовые файлы в папку полнотекстовой базы данных.
Преобразование ссылок с помощью глобальной корректировки
Если возможно преобразование ссылок путём замены начала ссылки, оно может быть осуществлено с помощью глобальной корректировки.
Например, это может быть полезно в следующих случаях:
- Корректировка абсолютных ссылок в относительные после включения текстов из электронного каталога с относительными ссылками. Этот вариант описан в подразделе Включение текстов из электронного каталога с относительными ссылками данной статьи.
- Включение текстов со ссылками URL в два этапа: 1) включение текстов в полнотекстовую базу с помощью АРМ Администратор полнотекстовых БД через диалоговое окно обзора папок и файлов с относительными или абсолютными ссылками; 2) преобразование ссылок в URL с помощью глобальной корректировки. Тексты при этом должны быть доступны по заданным URL.
Пример глобальной корректировки абсолютных ссылок в относительные, которую можно использовать в случае включения текстов из электронного каталога с относительными ссылками:
- оператор
REP
- поле/подполе
952^B
- формат
'.',&uf('+960*',&uf('+95','c:\irbis64\datai\ibis'),'#',v952^B)
где
c:\irbis64\datai\ibis
это путь к папке базы данных исходного электронного каталога.
Требования и рекомендации по отношению к текстовым документам, включаемым в полнотекстовую базу
Требования и рекомендации по отношению к документам формата PDF
Рекомендуется использовать файлы стандарта PDF/A, специально предназначенного для долгосрочного архивного хранения документов.
Для увеличения скорости загрузки документов пользователем и снижения нагрузки на сервер, где располагаются полные тексты и Веб-шлюз ИРБИС, рекомендуется включать быстрый просмотр в web PDF-документов.
Требования и рекомендации по отношению к документам формата HTML
Если в полнотекстовом документе в формате HTML имеются ссылки на изображения или другие страницы, то они должны быть указаны в форме URL.
Рецепты работы с полнотекстовыми базами данных ИРБИС
Создание полнотекстовой базы на основе ссылок на тексты электронного каталога для распространения на CD/DVD
Для выполнения задачи требуется:
- база данных исходного электронного каталога и связанные с ней текстовые файлы,
- программное обеспечение ИРБИС для работы с полнотекстовыми базами данных,
- АРМ Каталогизатор ИРБИС.
Краткая инструкция:
- Создать новую полнотекстовую базу с помощью АРМ Администратор полнотекстовых баз данных.
- Включить в полнотекстовую базу данных тексты из электронного каталога (см. подраздел Включение текстов из электронного каталога статьи АРМ Администратор полнотекстовых БД).
- Преобразовать абсолютные ссылки в относительные с помощью глобальной корректировки и скопировать тексты из исходного электронного каталога в полнотекстовую базу данных (см. подраздел Включение текстов из электронного каталога с относительными ссылками данной статьи).
Ссылки
См. также: