Конфигурационные параметры ИРБИС для полнотекстовых БД
В данной статье описаны конфигурационные параметры, специфичные для программных продуктов ИРБИС 64 для полнотекстовых баз данных и соответствующих конфигурационных файлов:
- Конфигурационный файл для АРМ Администратор полнотекстовых БД. Местонахождение и имя этого конфигурационного файла описано в статье Файлы ИРБИС.
- Конфигурационный файл для АРМ Читатель для полнотекстовых БД. Местонахождение и имя этого конфигурационного файла описано в статье Файлы ИРБИС.
Эти конфигурационные файлы являются стандартными ini-файлами и состоят из набора секций.
Описание конфигурационных параметров для Веб-шлюза ИРБИС для полнотекстовых БД см. в документе Техническая документация WEB ИРБИС64 и WEB ИРБИС32 актуальная версия которого доступна на форуме.
Содержание
- 1 Принятый формат записи параметров, указывающих местонахождение на файловой системе
- 2 Параметры, сгруппированные по АРМ
- 3 Параметры, сгруппированные по назначению
- 4 Ссылки
Принятый формат записи параметров, указывающих местонахождение на файловой системе
Обычно эти параметры представляют собой относительный путь, начинающийся со знака "." (со знака точка). Знак точка обозначает местонахождение исполняемого файла, использующего данный конфигурационный файл.
Например, параметр PDFTK содержит относительный путь к файлу pdftk.exe, и в качестве исходного имеет следующее значение:
.\Converters\PDFTK\
Параметры, сгруппированные по АРМ
Параметры АРМ Администратор полнотекстовых БД (irbisa_fulltext.ini)
Секция ABBY
DeveloperSN
- irbisa_fulltext.ini, секция ABBY
- Назначение: Серийный номер, указанный на USB-ключе.
- Подробнее об использовании параметра см. в подразделе Секция ABBY (irbisa_fulltext.ini).
EngineDllPath
- irbisa_fulltext.ini, секция ABBY
- Назначение: Полный путь к библиотеке FREngine.dll.
- Подробнее об использовании параметра см. в подразделе Секция ABBY (irbisa_fulltext.ini).
FR_LANGUAGES
- irbisa_fulltext.ini, секция ABBY
- Назначение: Cписок предполагаемых языков, используемый при распознавании.
- Подробнее об использовании параметра см. в подразделе Секция ABBY (irbisa_fulltext.ini).
Секция TEXTS
Converter_PDF
- irbisa_fulltext.ini, секция TEXTS
- Назначение: В зависимости от значения этого параметра происходит выбор утилиты, преобразующей файл в формате PDF в текстовый формат.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Выбор утилиты.
Converter_Word
- irbisa_fulltext.ini, секция TEXTS
- Назначение: В зависимости от значения этого параметра происходит выбор способа извлечения текста из DOC-файлов.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Выбор утилиты.
MAX_TIME_CONVERTING
- irbisa_fulltext.ini, секция TEXTS
- Назначение: Задаёт максимальное время работы (в секундах) утилит, выполняющих извлечение текста и извлечение страниц из полнотекстовых документов. Это бывает необходимо в некоторых случаях, когда не хватает отведённого времени.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Прочие параметры, касающиеся обработки текстовых файлов.
PDF2TXT
- irbisa_fulltext.ini, секция TEXTS
- Назначение: Значение этого параметра – относительный путь к файлу pdftotext.exe (утилите, преобразующей файл в формате PDF в текстовый формат).
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Местонахождение утилиты.
PDFPassword
- irbisa_fulltext.ini, секция TEXTS
- Назначение: Пароль, с помощью которого защищены PDF-файлы.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Защищённые PDF.
PDFTextExtractUtilityOrder
- irbisa_fulltext.ini, секция TEXTS
- Назначение: Значение этого параметра задаёт очерёдность применения утилит для извлечения текста из PDF-файлов.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Выбор утилиты.
isNeedDecryptPDF
- irbisa_fulltext.ini, секция TEXTS
- Назначение: Признак использования защищённых PDF-файлов.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Защищённые PDF.
isNeedRefreshBriefText
- irbisa_fulltext.ini, секция TEXTS
- Назначение: В зависимости от значения этого параметра изменяется логика обновления поля 22 (первые строки текста) при создании и актуализации словаря.
- Подробнее об использовании параметра см. в подразделе Секция TEXTS (irbisa_fulltext.ini).
isNeedSplitInsteadExtract
- irbisa_fulltext.ini, секция TEXTS
- Назначение: Этот параметр касается некоторых особенностей использования утилит по разбиению PDF-файлов на страницы.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Прочие параметры, касающиеся обработки текстовых файлов.
isSboychakovThemeDictionaryEnable
- irbisa_fulltext.ini, секция TEXTS
- Назначение: Управляет построением тематического словаря.
- Подробнее об использовании параметра см. в подразделе Секция TEXTS (irbisa_fulltext.ini).
method9_tryNotUseDirectDBAccess
- irbisa_fulltext.ini, секция TEXTS
- Назначение: Управляет интерпретацией ссылок на полные тексты.
- Подробнее об использовании параметра см. в подразделе Секция TEXTS (irbisa_fulltext.ini).
Секция TEXTS,MAIN
DJVU2DJVU
- irbisa_fulltext.ini, секция TEXTS,MAIN
- Назначение: Значение этого параметра – относительный путь к файлам: djvutxt.exe (утилите, преобразующей файл в формате DJVU в текстовый формат) и djvused.exe (утилите, разбивающей файл в формате DJVU на отдельные страницы).
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Местонахождение утилиты.
FULL_TEXT_FileNamePrefixDiv
- irbisa_fulltext.ini, секция TEXTS,MAIN
- Назначение: Разделитель имени файла и номера страницы, используемый для записи ссылок на полные тексты в базе данных.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Прочие параметры, касающиеся обработки текстовых файлов.
PDF2PDF
- irbisa_fulltext.ini, секция TEXTS,MAIN
- Назначение: Значение этого параметра – относительный путь к файлу pdf2pdf.exe (утилите, разбивающей файл в формате PDF на отдельные страницы).
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Местонахождение утилиты.
PDFSplitUtilityOrder
- irbisa_fulltext.ini, секция TEXTS,MAIN
- Назначение: Значение этого параметра задаёт очерёдность применения утилит для разбиения PDF-файлов на страницы.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Выбор утилиты.
PDFSplitter
- irbisa_fulltext.ini, секция TEXTS,MAIN
- Назначение: В зависимости от значения этого параметра происходит выбор утилиты, разбивающей файл в формате PDF на отдельные страницы.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Выбор утилиты.
PDFTK
- irbisa_fulltext.ini, секция TEXTS,MAIN
- Назначение: Значение этого параметра – относительный путь к файлу pdftk.exe (утилите, разбивающей файл в формате PDF на отдельные страницы).
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Местонахождение утилиты.
TextCacheRootPath
- irbisa_fulltext.ini, секция TEXTS,MAIN
- Назначение: Список условных названий папкам с полными текстами.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Кеширование страниц многостраничного документа.
TextPath
- irbisa_fulltext.ini, секция TEXTS,MAIN
- Назначение: Список путей к папкам с полными текстами.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Кеширование страниц многостраничного документа.
TextPathAlias
- irbisa_fulltext.ini, секция TEXTS,MAIN
- Назначение: Список путей к папкам с полными текстами.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Кеширование страниц многостраничного документа.
Параметры АРМ Читатель полнотекстовых БД (irbisr_fulltext.ini)
Секция MAIN
BriefPft
- irbisr_fulltext.ini, секция MAIN
- Назначение: Значение этого параметра – имя формата (без расширения), формирующего "середину" HTML-страницы с результатами поиска.
- Подробнее об использовании параметра см. в подразделе Секция MAIN (irbisr_fulltext.ini).
CheckBox_SearchInResults_Visible
- irbisr_fulltext.ini, секция MAIN
- Назначение: Признак видимости панели ""Искать в найденном"".
- Подробнее об использовании параметра см. в подразделе Секция MAIN (irbisr_fulltext.ini).
CountSearchResults
- irbisr_fulltext.ini, секция MAIN
- Назначение: Максимальное число ответов.
- Подробнее об использовании параметра см. в подразделе Секция MAIN (irbisr_fulltext.ini).
Front_FullTextWindow
- irbisr_fulltext.ini, секция MAIN
- Назначение: Признак - полный текст в окне ""сверху"".
- Подробнее об использовании параметра см. в подразделе Секция MAIN (irbisr_fulltext.ini).
Full_Text_Name
- irbisr_fulltext.ini, секция MAIN
- Назначение: Метка поля с адресом файла полного текста.
- Подробнее об использовании параметра см. в подразделе Секция MAIN (irbisr_fulltext.ini).
Full_Text_Prefix
- irbisr_fulltext.ini, секция MAIN
- Назначение: Префикс для терминов полнотекстового поиска.
- Подробнее об использовании параметра см. в подразделе Секция MAIN (irbisr_fulltext.ini).
Link_with_search_terms
- irbisr_fulltext.ini, секция MAIN
- Назначение: Признак - подключение оператора поиска по термину запроса для файла PDF.
- Подробнее об использовании параметра см. в подразделе Секция MAIN (irbisr_fulltext.ini).
Morph_search_terms
- irbisr_fulltext.ini, секция MAIN
- Назначение: Передача в ""Акробат"" терминов с морфологией.
- Подробнее об использовании параметра см. в подразделе Секция MAIN (irbisr_fulltext.ini).
PanelForListSch_Visible
- irbisr_fulltext.ini, секция MAIN
- Назначение: Признак - видимость списка видов библиографического поиска.
- Подробнее об использовании параметра см. в подразделе Секция MAIN (irbisr_fulltext.ini).
Panel_ChooseDB_Visible
- irbisr_fulltext.ini, секция MAIN
- Назначение: Признак видимости панели выбора БД.
- Подробнее об использовании параметра см. в подразделе Секция MAIN (irbisr_fulltext.ini).
Panel_Context_Visible
- irbisr_fulltext.ini, секция MAIN
- Назначение: Признак видимости панели ""Контекст"".
- Подробнее об использовании параметра см. в подразделе Секция MAIN (irbisr_fulltext.ini).
Panel_StructFilter_Visible
- irbisr_fulltext.ini, секция MAIN
- Назначение: Признак видимости панели ""ограничение"".
- Подробнее об использовании параметра см. в подразделе Секция MAIN (irbisr_fulltext.ini).
RESULTRANGEPUMP
- irbisr_fulltext.ini, секция MAIN
- Назначение: Количество ответов в порции.
- Подробнее об использовании параметра см. в подразделе Секция MAIN (irbisr_fulltext.ini).
Result_FullTextWindow
- irbisr_fulltext.ini, секция MAIN
- Назначение: Признак - полный текст в окне результатов поиска.
- Подробнее об использовании параметра см. в подразделе Секция MAIN (irbisr_fulltext.ini).
ToolBar_View_Visible
- irbisr_fulltext.ini, секция MAIN
- Назначение: Признак видимости панели переключения словаря-окон.
- Подробнее об использовании параметра см. в подразделе Секция MAIN (irbisr_fulltext.ini).
ToolButtonKeyBoard_Visible
- irbisr_fulltext.ini, секция MAIN
- Назначение: Признак видимости кнопки виртуальной клавиатуры.
- Подробнее об использовании параметра см. в подразделе Секция MAIN (irbisr_fulltext.ini).
WORKDIR
- irbisr_fulltext.ini, секция MAIN
- Назначение: Папка для сохранения временных выходных данных.
- Подробнее об использовании параметра см. в подразделе Секция MAIN (irbisr_fulltext.ini).
Секция SEARCHRESULTHTML
IsNeedAddSomeTags
- irbisr_fulltext.ini, секция SearchResultHTML
- Назначение: Признак того, составит ли АРМ Читатель для полнотекстовых баз данных HTML-страницу с результатами поиска исключительно из результатов работы соответствующих форматов, или же будет добавлять некоторые теги.
- Подробнее об использовании параметра см. в подразделе Секция MAIN (irbisr_fulltext.ini).
SearchEmpty
- irbisr_fulltext.ini, секция SearchResultHTML
- Назначение: Значение этого параметра – имя формата, формирующего HTML-страницу с пустым результатом поиска.
- Подробнее об использовании параметра см. в подразделе Секция SearchResultHTML (irbisr_fulltext.ini).
SearchFooter
- irbisr_fulltext.ini, секция SearchResultHTML
- Назначение: Значение этого параметра – имя формата (или список имён форматов, перечисленных через запятую без пробелов), формирующего "подвал" HTML-страницы с результатами поиска.
- Подробнее об использовании параметра см. в подразделе Секция SearchResultHTML (irbisr_fulltext.ini).
SearchHeader
- irbisr_fulltext.ini, секция SearchResultHTML
- Назначение: Значение этого параметра – имя формата (или список имён форматов, перечисленных через запятую без пробелов), формирующего "заголовок" HTML-страницы с результатами поиска.
- Подробнее об использовании параметра см. в подразделе Секция SearchResultHTML (irbisr_fulltext.ini).
Секция TEXTS,MAIN
DJVU2DJVU
- irbisr_fulltext.ini, секция TEXTS,MAIN
- Назначение: Значение этого параметра – относительный путь к файлам: djvutxt.exe (утилите, преобразующей файл в формате DJVU в текстовый формат) и djvused.exe (утилите, разбивающей файл в формате DJVU на отдельные страницы).
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Местонахождение утилиты.
FULL_TEXT_FileNamePrefixDiv
- irbisr_fulltext.ini, секция TEXTS,MAIN
- Назначение: Разделитель имени файла и номера страницы, используемый для записи ссылок на полные тексты в базе данных.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Прочие параметры, касающиеся обработки текстовых файлов.
PDF2PDF
- irbisr_fulltext.ini, секция TEXTS,MAIN
- Назначение: Значение этого параметра – относительный путь к файлу pdf2pdf.exe (утилите, разбивающей файл в формате PDF на отдельные страницы).
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Местонахождение утилиты.
PDFSplitUtilityOrder
- irbisr_fulltext.ini, секция TEXTS,MAIN
- Назначение: Значение этого параметра задаёт очерёдность применения утилит для разбиения PDF-файлов на страницы.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Выбор утилиты.
PDFSplitter
- irbisr_fulltext.ini, секция TEXTS,MAIN
- Назначение: В зависимости от значения этого параметра происходит выбор утилиты, разбивающей файл в формате PDF на отдельные страницы.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Выбор утилиты.
PDFTK
- irbisr_fulltext.ini, секция TEXTS,MAIN
- Назначение: Значение этого параметра – относительный путь к файлу pdftk.exe (утилите, разбивающей файл в формате PDF на отдельные страницы).
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Местонахождение утилиты.
TextCacheRootPath
- irbisr_fulltext.ini, секция TEXTS,MAIN
- Назначение: Список условных названий папкам с полными текстами.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Кеширование страниц многостраничного документа.
TextPath
- irbisr_fulltext.ini, секция TEXTS,MAIN
- Назначение: Список путей к папкам с полными текстами.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Кеширование страниц многостраничного документа.
TextPathAlias
- irbisr_fulltext.ini, секция TEXTS,MAIN
- Назначение: Список путей к папкам с полными текстами.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
- Подробнее об использовании параметра см. в подразделе Кеширование страниц многостраничного документа.
Секция ИМЯ_БАЗЫ_ДАННЫХ
SearchFrames
- irbisr_fulltext.ini, секция имя_базы_данных
- Назначение: Значение этого параметра – список имён форматов, перечисленных через запятую без пробелов, формирующих "заголовок" и "подвал" HTML-страницы с результатами поиска.
- Подробнее об использовании параметра см. в подразделе Секция с именем базы данных.
Параметры, сгруппированные по назначению
Обработка текстовых файлов
Ряд параметров имеет отношение к обработке текстовых файлов, подлежащих полнотекстовому индексированию.
Параметры из этого ряда, применимые только по отношению к АРМ Администратор см. в подразделе Обработка текстовых файлов а АРМ Администратор.
В данном подразделе рассмотрены параметры, применимые как для АРМ Администратор, так и для АРМ Читатель.
В конфигурационном файле АРМ Администратор полнотекстовых БД данные параметры находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД данные параметры находятся в секции MAIN.
Местонахождение утилиты
PDFTK
- irbisa_fulltext.ini,irbisr_fulltext.ini, секция TEXTS,MAIN
- Назначение: Значение этого параметра – относительный путь к файлу pdftk.exe (утилите, разбивающей файл в формате PDF на отдельные страницы).
- Использование: Исходное значение параметра в конфигурационном файле – .\Converters\PDFTK\.
- Информация о версиях: Параметр введён в версии ИРБИС 2009.1.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
PDF2PDF
- irbisa_fulltext.ini,irbisr_fulltext.ini, секция TEXTS,MAIN
- Назначение: Значение этого параметра – относительный путь к файлу pdf2pdf.exe (утилите, разбивающей файл в формате PDF на отдельные страницы).
- Использование: Исходное значение параметра в конфигурационном файле – .\Converters\PDF2PDF\.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
PDF2TXT
- irbisa_fulltext.ini, секция TEXTS
- Назначение: Значение этого параметра – относительный путь к файлу pdftotext.exe (утилите, преобразующей файл в формате PDF в текстовый формат).
- Использование: Исходное значение параметра в конфигурационном файле – .\Converters\PDF2TXT\.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
DJVU2DJVU
- irbisa_fulltext.ini,irbisr_fulltext.ini, секция TEXTS,MAIN
- Назначение: Значение этого параметра – относительный путь к файлам: djvutxt.exe (утилите, преобразующей файл в формате DJVU в текстовый формат) и djvused.exe (утилите, разбивающей файл в формате DJVU на отдельные страницы).
- Использование: Исходное значение параметра в конфигурационном файле – .\Converters\djvu2djvu\.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
Выбор утилиты
Converter_PDF
- irbisa_fulltext.ini, секция TEXTS
- Назначение: В зависимости от значения этого параметра происходит выбор утилиты, преобразующей файл в формате PDF в текстовый формат.
- Использование: Возможные значения этого параметра: 0 – использовать утилиту docs2text.exe; 1 – использовать утилиту pdftotext.exe. Отсутствие параметра эквивалентно присвоению значения 0. Исходное значение параметра в конфигурационном файле – 1.
- Информация о версиях: В версии ИРБИС 2011.1 параметр теряет актуальность в связи с появлением параметра PDFTextExtractUtilityOrder.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
Converter_Word
- irbisa_fulltext.ini, секция TEXTS
- Назначение: В зависимости от значения этого параметра происходит выбор способа извлечения текста из DOC-файлов.
- Использование: Возможные значения параметра: 0 – использовать утилиту docs2text.exe; 1 – использовать программу Microsoft Word (по технологии Ole Automation). Отсутствие параметра эквивалентно присвоению значения 0. Исходное значение параметра в конфигурационном файле – 0.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
PDFSplitter
- irbisa_fulltext.ini,irbisr_fulltext.ini, секция TEXTS,MAIN
- Назначение: В зависимости от значения этого параметра происходит выбор утилиты, разбивающей файл в формате PDF на отдельные страницы.
- Использование: Возможные значения этого параметра: PDFTK и PDF2PDF. Отсутствие параметра эквивалентно присвоению значения PDF2PDF. Исходное значение параметра в конфигурационном файле – PDFTK.
- Информация о версиях: Параметр введён в версии ИРБИС 2009.1. В версии ИРБИС 2011.1 параметр теряет актуальность в связи с появлением параметра PDFSplitUtilityOrder.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
PDFSplitUtilityOrder
- irbisa_fulltext.ini,irbisr_fulltext.ini, секция TEXTS,MAIN
- Назначение: Значение этого параметра задаёт очерёдность применения утилит для разбиения PDF-файлов на страницы.
- Использование: Параметр составляется из условных обозначений утилит, перечисленных через запятую. Допустимые обозначения утилит: PDF2PDF – утилита PDF2PDF.exe; PDFTK – утилита PDFTK.exe. При наличии PDFSplitUtilityOrder значение параметра PDFSplitter не играет роли; при отсутствии PDFSplitUtilityOrder используется утилита, соответствующая значению параметра PDFSplitter. Исходное значение параметра в конфигурационном файле – PDFTK,PDF2PDF.
- Информация о версиях: Параметр введён в версии ИРБИС 2011.1.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
PDFTextExtractUtilityOrder
- irbisa_fulltext.ini, секция TEXTS
- Назначение: Значение этого параметра задаёт очерёдность применения утилит для извлечения текста из PDF-файлов.
- Использование: Параметр составляется из условных обозначений утилит, перечисленных через запятую. Допустимые обозначения утилит: PDFToText – утилита pdftotext.exe; Docs2Text – утилита docs2text.exe. При наличии PDFTextExtractUtilityOrder значение параметра Converter_PDF не играет роли; при отсутствии PDFTextExtractUtilityOrder используется утилита, соответствующая значению параметра Converter_PDF. Исходное значение параметра в конфигурационном файле – PDFToText,Docs2Text.
- Информация о версиях: Параметр введён в версии ИРБИС 2011.1.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
Защищённые PDF
isNeedDecryptPDF
- irbisa_fulltext.ini, секция TEXTS
- Назначение: Признак использования защищённых PDF-файлов.
- Использование: Возможные значения этого параметра: 0 – не снимать защиту; 1 – снимать защиту в процессе индексирования. Отсутствие параметра эквивалентно присвоению значения 0. Исходное значение параметра в конфигурационном файле – 0. Для снятия защиты используется пароль, указанный в параметре PDFPassword.
- Информация о версиях: Параметр введён в версии ИРБИС 2012.1.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
PDFPassword
- irbisa_fulltext.ini, секция TEXTS
- Назначение: Пароль, с помощью которого защищены PDF-файлы.
- Использование: Данный параметр используется в связке с параметром isNeedDecryptPDF.
- Информация о версиях: Параметр введён в версии ИРБИС 2012.1.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
Кеширование страниц многостраничного документа
TextPath
- irbisa_fulltext.ini,irbisr_fulltext.ini, секция TEXTS,MAIN
- Назначение: Список путей к папкам с полными текстами.
- Использование: Об использовании параметра см. в статье Отличия ИРБИС 2012.1 от предыдущей версии.
- Информация о версиях: Параметр введён в версии ИРБИС 2012.1.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
TextPathAlias
- irbisa_fulltext.ini,irbisr_fulltext.ini, секция TEXTS,MAIN
- Назначение: Список путей к папкам с полными текстами.
- Использование: Об использовании параметра см. в статье Отличия ИРБИС 2012.1 от предыдущей версии.
- Информация о версиях: Параметр введён в версии ИРБИС 2012.1.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
TextCacheRootPath
- irbisa_fulltext.ini,irbisr_fulltext.ini, секция TEXTS,MAIN
- Назначение: Список условных названий папкам с полными текстами.
- Использование: Об использовании параметра см. в статье Отличия ИРБИС 2012.1 от предыдущей версии.
- Информация о версиях: Параметр введён в версии ИРБИС 2012.1.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
Прочие параметры, касающиеся обработки текстовых файлов
FULL_TEXT_FileNamePrefixDiv
- irbisa_fulltext.ini,irbisr_fulltext.ini, секция TEXTS,MAIN
- Назначение: Разделитель имени файла и номера страницы, используемый для записи ссылок на полные тексты в базе данных.
- Использование: Отсутствие параметра эквивалентно присвоению значения __. Исходное значение параметра в конфигурационном файле – __.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
isNeedSplitInsteadExtract
- irbisa_fulltext.ini, секция TEXTS
- Назначение: Этот параметр касается некоторых особенностей использования утилит по разбиению PDF-файлов на страницы.
- Использование: Значение этого параметра определяет, как будет происходить получение страницы из PDF-файла при обработке ссылки на страницу. Возможные значения параметра: 0 – извлекать одну конкретную страницу; 0 – извлекать скопом все страницы из PDF-файла одной командой утилите. Отсутствие параметра эквивалентно присвоению значения 1. В исходном варианте параметр отсутствует в конфигурационном файле.
- Информация о версиях: Параметр введён в версии ИРБИС 2012.1.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
Время извлечения всех страниц скопом может быть значительно меньше времени извлечения каждой страницы, особенно это заметно на больших файлах. Благодаря кэшированию извлечённых страниц, соответствующие страницы будут использованы, когда дойдёт очередь до их обработки. Поскольку, в большинстве случаев необходимо обработать все страницы PDF-документов, эффективнее использовать значение параметра 1.
Примечание: используемая утилита по извлечению страниц из DJVU-файлов не имеет соответствующей операции по извлечению страниц скопом, поэтому к DJVU-файлам данная логика не применима.
MAX_TIME_CONVERTING
- irbisa_fulltext.ini, секция TEXTS
- Назначение: Задаёт максимальное время работы (в секундах) утилит, выполняющих извлечение текста и извлечение страниц из полнотекстовых документов. Это бывает необходимо в некоторых случаях, когда не хватает отведённого времени.
- Использование: Отсутствие параметра эквивалентно присвоению значения 100. Исходное значение параметра в конфигурационном файле – 100.
- Информация о версиях: Параметр введён в версии ИРБИС 2012.1.
- Дополнительно: В конфигурационном файле АРМ Администратор полнотекстовых БД параметр находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД – в секции MAIN.
Параметры АРМ Администратор полнотекстовых БД
Секция TEXTS (irbisa_fulltext.ini)
isNeedRefreshBriefText
- irbisa_fulltext.ini, секция TEXTS
- Назначение: В зависимости от значения этого параметра изменяется логика обновления поля 22 (первые строки текста) при создании и актуализации словаря.
- Использование: Возможные значения этого параметра: 0 – не обновлять, если в поле уже есть текст; 1 – обновлять поле безусловно. Отсутствие параметра эквивалентно присвоению значения 1. Исходное значение параметра в конфигурационном файле – 1.
- Информация о версиях: Параметр введён в версии ИРБИС 2011.1.
isSboychakovThemeDictionaryEnable
- irbisa_fulltext.ini, секция TEXTS
- Назначение: Управляет построением тематического словаря.
- Использование: Возможные значения этого параметра: 0 – не строить тематический словарь; 1 – строить тематический словарь. Отсутствие параметра эквивалентно присвоению значения 0. Исходное значение параметра в конфигурационном файле – 0.
- Информация о версиях: Параметр введён в версии ИРБИС 2011.1.
Примечание: работа с тематическими словарями более не поддерживается, поэтому рекомендуется не включать данную функциональность.
method9_tryNotUseDirectDBAccess
- irbisa_fulltext.ini, секция TEXTS
- Назначение: Управляет интерпретацией ссылок на полные тексты.
- Использование: Включение данного параметра значит, что требуется в 9 методе ТВП по возможности не использовать непосредственное чтение ссылки на текст из БД. Это возможно, если соответствующий элемент (результат работы формата в ТВП) является ссылкой на полный текст в формате БД, предварённой префиксом "FT-DB-LNK:". При этом параметр FULL_TEXT_Name не используется. Если нет возможности не использовать непосредственное чтение ссылки на текст из БД, то работает старый алгоритм (новая реализация старого алгоритма). Если значение параметра method9_tryNotUseDirectDBAccess=0, то работает старый алгоритм (старая реализация старого алгоритма). Отсутствие параметра эквивалентно присвоению значения 0. Исходное значение параметра в конфигурационном файле – 0.
- Информация о версиях: Параметр введён в версии ИРБИС 2013.1 и последних обновлениях версий 2012.1 и 2011.1.
Секция ABBY (irbisa_fulltext.ini)
Секция ABBY имеет отношение только к АРМ Администратор полнотекстовых БД, и используется при создании имидж-каталога.
EngineDllPath
- irbisa_fulltext.ini, секция ABBY
- Назначение: Полный путь к библиотеке FREngine.dll.
DeveloperSN
- irbisa_fulltext.ini, секция ABBY
- Назначение: Серийный номер, указанный на USB-ключе.
FR_LANGUAGES
- irbisa_fulltext.ini, секция ABBY
- Назначение: Cписок предполагаемых языков, используемый при распознавании.
- Использование: Отсутствие параметра эквивалентно присвоению значения Russian,English,Ukrainian.
- Информация о версиях: Параметр введён в версии ИРБИС 2011.1.
Параметры АРМ Читатель для полнотекстовых БД
Секция с именем базы данных
В секции с именем базы данных содержаться параметры, относящиеся только к данной базе.
SearchFrames
- irbisr_fulltext.ini, секция имя_базы_данных
- Назначение: Значение этого параметра – список имён форматов, перечисленных через запятую без пробелов, формирующих "заголовок" и "подвал" HTML-страницы с результатами поиска.
- Использование: Отсутствие параметра эквивалентно присвоению значения search_header.pft,Result,search_Footer.pft. Один или несколько форматов до слова Result формируют "заголовок". Один или несколько форматов после слова Result формируют "подвал". Само слово Result служит разделителем. В исходном варианте параметр отсутствует в конфигурационном файле.
Секция MAIN (irbisr_fulltext.ini)
В секции MAIN присутствует ряд параметров, определяющих обработку файлов полных текстов. Описание данных параметров см. в подразделе Конфигурационные параметры, определяющие обработку файлов полных текстов
BriefPft
- irbisr_fulltext.ini, секция MAIN
- Назначение: Значение этого параметра – имя формата (без расширения), формирующего "середину" HTML-страницы с результатами поиска.
- Использование: Исходное значение параметра в конфигурационном файле – BriefHTML.
CheckBox_SearchInResults_Visible
- irbisr_fulltext.ini, секция MAIN
- Назначение: Признак видимости панели ""Искать в найденном"".
CountSearchResults
- irbisr_fulltext.ini, секция MAIN
- Назначение: Максимальное число ответов.
IsNeedAddSomeTags
- irbisr_fulltext.ini, секция SearchResultHTML
- Назначение: Признак того, составит ли АРМ Читатель для полнотекстовых баз данных HTML-страницу с результатами поиска исключительно из результатов работы соответствующих форматов, или же будет добавлять некоторые теги.
- Использование: Возможные значения: 1 – добавлять теги к результату работы формата, 0 – не добавлять теги. Отсутствие параметра эквивалентно присвоению значения 1. В исходном варианте параметр отсутствует в конфигурационном файле.
- Информация о версиях: Параметр введён в версии ИРБИС 2010.1.
Front_FullTextWindow
- irbisr_fulltext.ini, секция MAIN
- Назначение: Признак - полный текст в окне ""сверху"".
Full_Text_Name
- irbisr_fulltext.ini, секция MAIN
- Назначение: Метка поля с адресом файла полного текста.
Full_Text_Prefix
- irbisr_fulltext.ini, секция MAIN
- Назначение: Префикс для терминов полнотекстового поиска.
Link_with_search_terms
- irbisr_fulltext.ini, секция MAIN
- Назначение: Признак - подключение оператора поиска по термину запроса для файла PDF.
Morph_search_terms
- irbisr_fulltext.ini, секция MAIN
- Назначение: Передача в ""Акробат"" терминов с морфологией.
Panel_ChooseDB_Visible
- irbisr_fulltext.ini, секция MAIN
- Назначение: Признак видимости панели выбора БД.
Panel_Context_Visible
- irbisr_fulltext.ini, секция MAIN
- Назначение: Признак видимости панели ""Контекст"".
Panel_StructFilter_Visible
- irbisr_fulltext.ini, секция MAIN
- Назначение: Признак видимости панели ""ограничение"".
PanelForListSch_Visible
- irbisr_fulltext.ini, секция MAIN
- Назначение: Признак - видимость списка видов библиографического поиска.
Result_FullTextWindow
- irbisr_fulltext.ini, секция MAIN
- Назначение: Признак - полный текст в окне результатов поиска.
RESULTRANGEPUMP
- irbisr_fulltext.ini, секция MAIN
- Назначение: Количество ответов в порции.
ToolBar_View_Visible
- irbisr_fulltext.ini, секция MAIN
- Назначение: Признак видимости панели переключения словаря-окон.
ToolButtonKeyBoard_Visible
- irbisr_fulltext.ini, секция MAIN
- Назначение: Признак видимости кнопки виртуальной клавиатуры.
WORKDIR
- irbisr_fulltext.ini, секция MAIN
- Назначение: Папка для сохранения временных выходных данных.
- Использование: Исходное значение параметра в конфигурационном файле – C:\irbiswrk. Если значение параметра не задано или параметр отсутствует, то для хранения временных файлов используется временная папка Windows.
Секция SearchResultHTML (irbisr_fulltext.ini)
SearchEmpty
- irbisr_fulltext.ini, секция SearchResultHTML
- Назначение: Значение этого параметра – имя формата, формирующего HTML-страницу с пустым результатом поиска.
- Использование: Отсутствие параметра эквивалентно присвоению значения search_empty.pft. В исходном варианте параметр отсутствует в конфигурационном файле.
SearchFooter
- irbisr_fulltext.ini, секция SearchResultHTML
- Назначение: Значение этого параметра – имя формата (или список имён форматов, перечисленных через запятую без пробелов), формирующего "подвал" HTML-страницы с результатами поиска.
- Использование: При отсутствии данного параметра и параметра SearchHeader используется значение параметра SearchFrames из секции соответствующей базы данных. В исходном варианте параметр отсутствует в конфигурационном файле.
SearchHeader
- irbisr_fulltext.ini, секция SearchResultHTML
- Назначение: Значение этого параметра – имя формата (или список имён форматов, перечисленных через запятую без пробелов), формирующего "заголовок" HTML-страницы с результатами поиска.
- Использование: При отсутствии данного параметра и параметра SearchFooter используется значение параметра SearchFrames из секции соответствующей базы данных. В исходном варианте параметр отсутствует в конфигурационном файле.
Ссылки
См. также:
- Параметры настройки системы
- Параметры настройки системы (информация сверена с базой HLPINI)
- Конфигурационный файл веб-шлюза ИРБИС irbis server.ini
- Конфигурационный файл TCP/IP сервера ИРБИС 64
- Техническая документация WEB ИРБИС64 и WEB ИРБИС32. Актуальная версия документа доступна на форуме.
Источники информации: