Установка и использование ИРБИС 64 для полнотекстовых баз данных
Содержание
- 1 Рекомендации по установке
- 2 Рекомендации по использованию и настройке
- 2.1 Рекомендации по созданию полнотекстовой базы данных
- 2.2 Типовые действия администратора при формировании полнотекстовой базы
- 2.3 Организация доступа пользователей к полнотекстовым базам с помощью АРМ Читатель полнотекстовых БД
- 2.4 Организация доступа пользователей к полнотекстовым базам через веб-браузер с помощью веб-шлюза ИРБИС
- 2.5 Использование относительных ссылок
- 2.6 Использование абсолютных ссылок
- 2.7 Использование URL-ссылок
- 2.8 Включение текстов из электронного каталога с относительными ссылками
- 2.9 Преобразование ссылок с помощью глобальной корректировки
- 2.10 Требования и рекомендации по отношению к текстовым документам, включаемым в полнотекстовую базу
- 3 Рецепты работы с полнотекстовыми базами данных ИРБИС
- 4 Ссылки
Рекомендации по установке
Установочный пакет Полнотекстовые базы данных ИРБИС 64
Для установки АРМ Администратор полнотекстовых БД и АРМ Читатель для полнотекстовых БД предназначен установочный пакет Полнотекстовые базы данных ИРБИС 64 (файл setup64_FullText.exe).
Окно установщика Полнотекстовые базы данных ИРБИС 64:
Примечание: при появлении в процессе установки сообщения "При регистрации dll библиотеки произошла ошибка. Необходимо в ручном режиме зарегистрировать dll библиотеку ...\doc2text.dll" воспользуйтесь инструкцией Регистрация библиотеки docs2text.dll с помощью инструмента Windows Regsvr32.exe.
Установка ИРБИС 64 для полнотекстовых баз данных в одну папку с обычным ИРБИС 64
Возможна установка ИРБИС 64 для полнотекстовых баз данных в одну папку с серверной частью ИРБИС 64.
Этот вариант установки полезен тем, что обеспечивает возможность воспользоваться инструментами обычного ИРБИС по отношению к полнотекстовым базам данных. Например, полезной бывает возможность редактировать полнотекстовую базу данных с помощью АРМ Каталогизатор.
Установка Веб-шлюза ИРБИС для полнотекстовых баз данных
Установка Веб-шлюза ИРБИС для полнотекстовых баз данных осуществляется отдельным установщиком. См. статью Установка Веб-шлюза Ирбис 64.
Регистрация библиотеки docs2text.dll с помощью инструмента Windows Regsvr32.exe
Регистрация библиотеки docs2text.dll выполняется автоматически в процессе установки пакета Полнотекстовые базы данных ИРБИС 64.
Иногда возникает необходимость зарегистрировать библиотеку docs2text.dll в "ручном режиме" с помощью инструмента Windows Regsvr32.exe. Для этого достаточно выполнить следующую последовательность шагов:
- В командной строке установить текущей папку, в которой находится файл docs2text.dll (это папка, в которую установлена серверная часть ИРБИС).
- Выполнить команду regsvr32 docs2text.dll:
- Убедиться, что команда выполнена успешно. Команда выполнена успешно, если получено соответствующее сообщение:
Рекомендации по использованию и настройке
Рекомендации по созданию полнотекстовой базы данных
Типовые действия администратора при формировании полнотекстовой базы осуществляется очень просто, как описано в подразделе Типовые действия администратора при формировании полнотекстовой базы данной статьи.
При этом администратор ИРБИС должен понимать взаимосвязь вопросов размещения полнотекстовых документов, выбора в ИРБИС вида ссылок на полные тексты, а также доступа пользователей к полным текстам через АРМ Читатель полнотекстовых БД и через веб-браузер с помощью веб-шлюза ИРБИС. Эта взаимосвязь описывается в нижеследующих подразделах.
Типовые действия администратора при формировании полнотекстовой базы
При формировании полнотекстовой базы данных администратор баз данных ИРБИС выполняет следующие действия:
- Выбор существующей или создание новой полнотекстовой базы данных.
- Добавление текстов в базу данных или удаление текстов из базы.
- Актуализация или создание словаря базы данных (рекомендуется ознакомиться с особенностями обслуживания словаря полнотекстовых баз данных).
Организация доступа пользователей к полнотекстовым базам с помощью АРМ Читатель полнотекстовых БД
АРМ Читатель полнотекстовых БД обеспечивает доступ пользователей к коллекциям полнотекстовых документов в компьютерной сети с использованием файлового доступа.
Исходные условия:
- Дистрибутив Полнотекстовые базы данных ИРБИС 64 установлен на компьютере, который будет выступать в роли сервера.
- Требуется организовать доступ к полнотекстовым базам с компьютеров, выступающих в роли клиентов.
Для организации функционирования АРМ Читатель полнотекстовых БД на нескольких компьютерах в сети требуется:
- Открыть сетевой доступ к папке, в которой находится АРМ Читатель для полнотекстовых БД на сервере.
- На клиентах запускать АРМ Читатель для полнотекстовых БД из этой сетевой папки. Для удобства создать ярлыки на АРМ Читатель для полнотекстовых БД.
Ссылки на обсуждения по данной теме на форуме ИРБИС:
Организация доступа пользователей к полнотекстовым базам через веб-браузер с помощью веб-шлюза ИРБИС
Веб-шлюз ИРБИС для полнотекстовых баз данных обеспечивает доступ пользователей к коллекциям полнотекстовых документов через веб-браузер.
Если планируется использовать полнотекстовые базы через Веб, имеет значение вопрос выбора, какого вида ссылки на полные тексты будут использоваться, относительные, абсолютные или URL.
Рекомендуется использовать относительные ссылки по той причине, что в этом случае дополнительных настроек не требуется.
При использовании абсолютных ссылок в случае работы веб-пользователей в рамках локальной сети дополнительных настроек не требуется. Организация работы Интернет-пользователей при использовании абсолютных ссылок возможна при соблюдении следующих условий:
- Полнотекстовые документы должны быть доступны на веб или FTP сервере.
- Возможно преобразование абсолютных ссылок в URL путём замены начала ссылки.
- Чтобы это преобразование происходило, должна быть произведена настройка:
- В файле irbis_server.ini, который был создан при инсталляции в папке веб-сервера для Веб-шлюза ИРБИС, в секции MAIN задать параметры (приведен пример значений параметров):
FullTextPathDbn=\\Alio1\irbiswrk\lusia\PDF_text\ FullTextPathWeb=ftp:\\ftp.gpntb.ru\pub\irbis\
- В первом параметре следует указать сетевой путь на тексты, которые располагались по этому пути при их добавлении, в примере это - \\Alio1\irbiswrk\lusia\PDF_text\. Во втором параметре следует указать часть URL текстов (до их названия) их расположения. В примере это - ftp:\\ftp.gpntb.ru\pub\irbis\.
- В формате BRIEFHTML_ft.pft имеется вставка (если нет, добавить), которая замещает в адресе текста (в подполе 952^B) путь на файл при создании на URL местоположения текста. Часть формата:
/* возможность замены формата через параметры irbis_server.ini из cgi if &uf('IMAIN,FullTextPathDbn,')<>'' and &uf('IMAIN,FullTextPathWeb,')<>'' then &uf('+7W10#',&uf('+9I?',,&uf('IMAIN,FullTextPathDbn,'),,'?#',,&uf('IMAIN,FullTextPathWeb,'),,'#',v952^B)), '<a style="border:0px;font-size:12px;" target=_blank href="',G10, else /*
При использовании URL-ссылок дополнительных настроек не требуется. Нет возможности группового включения текстов с URL в полнотекстовую базу. Исключение составляют те случаи, когда возможно включение текстов в два этапа, как описано в подразделе Преобразование ссылок с помощью глобальной корректировки данной статьи.
Использование относительных ссылок
Особенности относительных ссылок:
- Тексты располагаются в папке базы данных.
- Возможно включение текстов в полнотекстовую базу с помощью АРМ Администратор полнотекстовых БД через диалоговое окно обзора папок и файлов.
- При включении текстов в полнотекстовую базу с помощью АРМ Администратор полнотекстовых БД путём импорта из электронного каталога администратор ИРБИС должен самостоятельно выполнить действия, описанные в подразделе Включение текстов из электронного каталога с относительными ссылками данной статьи.
- Тексты доступны пользователю опосредовано через Веб-шлюз ИРБИС, их URL представляют собой ссылки на Веб-шлюз ИРБИС с соответствующими командами для получения полного текста.
Использование абсолютных ссылок
Особенности абсолютных ссылок:
- Тексты располагаются в папке, открытой для доступа в локальной сети.
- Возможно включение текстов в полнотекстовую базу с помощью АРМ Администратор полнотекстовых БД через диалоговое окно обзора папок и файлов.
- Возможно включение текстов в полнотекстовую базу с помощью АРМ Администратор полнотекстовых БД путём импорта из электронного каталога.
- Тексты доступны пользователю через веб по URL, который возможно получить путём преобразования абсолютных ссылок, определяемого параметрами irbis_server.ini, как описано выше.
Использование URL-ссылок
Особенности URL-ссылок:
- Возможно включение текстов в полнотекстовую базу с помощью АРМ Администратор полнотекстовых БД путём импорта из электронного каталога.
- Нет возможности группового включения текстов с URL в полнотекстовую базу. Исключение составляют те случаи, когда возможно включение текстов в два этапа, как описано в подразделе Преобразование ссылок с помощью глобальной корректировки данной статьи.
- Тексты доступны пользователю через Веб по URL, указанному для каждого текста.
Включение текстов из электронного каталога с относительными ссылками
Даже в случае использования в исходном электронном каталоге относительных ссылок, в полнотекстовую базу будут добавлены абсолютные ссылки на тексты – полные пути к текстовым файлам, находящимся в папке базы данных исходного электронного каталога. Это абсолютные пути, начинающиеся с буквы диска, не соответствующие UNC.
Возможно преобразование этих абсолютных ссылок в относительные ссылки с помощью глобальной корректировки, как описано в подразделе Преобразование ссылок с помощью глобальной корректировки данной статьи. При этом необходимо скопировать текстовые файлы в папку полнотекстовой базы данных.
Преобразование ссылок с помощью глобальной корректировки
Если возможно преобразование путём замены начала ссылки, оно может быть осуществлено с помощью глобальной корректировки.
Например, это может быть полезно в следующих случаях:
- Корректировка абсолютных ссылок в относительные после включения текстов из электронного каталога с относительными ссылками. Этот вариант описан в подразделе Включение текстов из электронного каталога с относительными ссылками данной статьи.
- Включение текстов со ссылками URL в два этапа: 1) включение текстов в полнотекстовую базу с помощью АРМ Администратор полнотекстовых БД через диалоговое окно обзора папок и файлов с относительными или абсолютными ссылками; 2) преобразование ссылок в URL с помощью глобальной корректировки. Тексты при этом должны быть доступны по заданным URL.
Пример глобальной корректировки абсолютных ссылок в относительные, которую можно использовать в случае включения текстов из электронного каталога с относительными ссылками:
- оператор
REP
- поле/подполе
952^B
- формат
'.',&uf('+960*',&uf('+95','c:\irbis64\datai\ibis'),'#',v952^B)
где
c:\irbis64\datai\ibis
это путь к папке базы данных исходного электронного каталога.
Требования и рекомендации по отношению к текстовым документам, включаемым в полнотекстовую базу
Требования и рекомендации по отношению к документам формата PDF
Рекомендуется использовать файлы стандарта PDF/A, специально предназначенного для долгосрочного архивного хранения документов.
Для увеличения скорости загрузки документов пользователем и снижения нагрузки на сервер, где располагаются полные тексты и Веб-шлюз ИРБИС, рекомендуется включать быстрый просмотр в web PDF-документов.
Требования и рекомендации по отношению к документам формата HTML
Если в полнотекстовом документе в формате HTML имеются ссылки на изображения или другие страницы, то они должны быть указаны в форме URL.
Рецепты работы с полнотекстовыми базами данных ИРБИС
Создание полнотекстовой базы на основе ссылок на тексты электронного каталога для распространения на CD/DVD
Для выполнения задачи требуется:
- база данных исходного электронного каталога и связанные с ней текстовые файлы,
- программное обеспечение ИРБИС для работы с полнотекстовыми базами данных,
- АРМ Каталогизатор ИРБИС.
Краткая инструкция:
- Создать новую полнотекстовую базу с помощью АРМ Администратор полнотекстовых баз данных.
- Включить в полнотекстовую базу данных тексты из электронного каталога (см. подраздел Включение текстов из электронного каталога статьи АРМ Администратор полнотекстовых БД).
- Преобразовать абсолютные ссылки в относительные с помощью глобальной корректировки и скопировать тексты из исходного электронного каталога в полнотекстовую базу данных (см. подраздел Включение текстов из электронного каталога с относительными ссылками данной статьи).
Ссылки
См. также: