Конфигурационные параметры ИРБИС для полнотекстовых БД — различия между версиями

Материал из Wikipedia
Перейти к: навигация, поиск
(Параметры АРМ Читатель для полнотекстовых БД)
Строка 14: Строка 14:
 
  .\Converters\PDFTK\
 
  .\Converters\PDFTK\
  
==Параметры АРМ Администратор полнотекстовых БД==
+
==Параметры, сгруппированные по АРМ==
  
===Секция <tt>TEXTS</tt>===
 
  
====Обработка текстовых файлов в АРМ Администратор====
+
===Параметры АРМ Администратор полнотекстовых БД (<tt>irbisa_fulltext.ini</tt>)===
 +
 
 +
====Секция <tt>ABBY</tt>====
 +
 
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Секция ABBY (irbisa_fulltext.ini)
 +
|name=DeveloperSN
 +
|sectionName=ABBY
 +
|descr=Серийный номер, указанный на USB-ключе.
 +
|iniFiles=irbisa_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Секция ABBY (irbisa_fulltext.ini)
 +
|name=EngineDllPath
 +
|sectionName=ABBY
 +
|descr=Полный путь к библиотеке <tt>FREngine.dll</tt>.
 +
|iniFiles=irbisa_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Секция ABBY (irbisa_fulltext.ini)
 +
|name=FR_LANGUAGES
 +
|sectionName=ABBY
 +
|descr=Cписок предполагаемых языков, используемый при распознавании.
 +
|iniFiles=irbisa_fulltext.ini
 +
}}
 +
 
 +
====Секция <tt>TEXTS</tt>====
 +
 
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Выбор утилиты
 +
|name=Converter_PDF
 +
|sectionName=TEXTS
 +
|descr=В зависимости от значения этого параметра происходит выбор утилиты, преобразующей файл в формате PDF в текстовый формат.
 +
|iniFiles=irbisa_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Выбор утилиты
 +
|name=Converter_Word
 +
|sectionName=TEXTS
 +
|descr=В зависимости от значения этого параметра происходит выбор способа извлечения текста из <tt>DOC</tt>-файлов.
 +
|iniFiles=irbisa_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Прочие параметры, касающиеся обработки текстовых файлов
 +
|name=MAX_TIME_CONVERTING
 +
|sectionName=TEXTS
 +
|descr=Задаёт максимальное время работы (в секундах) утилит, выполняющих извлечение текста и извлечение страниц из полнотекстовых документов. Это бывает необходимо в [[Развёртывание программного обеспечения ИРБИС 64 для полнотекстовых баз данных#Требования и рекомендации по отношению к текстовым документам, включаемым в полнотекстовую базу|некоторых случаях, когда не хватает отведённого времени]].
 +
|iniFiles=irbisa_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Местонахождение утилиты
 +
|name=PDF2TXT
 +
|sectionName=TEXTS
 +
|descr=Значение этого параметра – относительный путь к файлу <tt>pdftotext.exe</tt> (утилите, преобразующей файл в формате PDF в текстовый формат).
 +
|iniFiles=irbisa_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Защищённые PDF
 +
|name=PDFPassword
 +
|sectionName=TEXTS
 +
|descr=Пароль, с помощью которого защищены PDF-файлы.
 +
|iniFiles=irbisa_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Выбор утилиты
 +
|name=PDFTextExtractUtilityOrder
 +
|sectionName=TEXTS
 +
|descr=Значение этого параметра задаёт очерёдность применения утилит для извлечения текста из PDF-файлов.
 +
|iniFiles=irbisa_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Защищённые PDF
 +
|name=isNeedDecryptPDF
 +
|sectionName=TEXTS
 +
|descr=Признак использования защищённых PDF-файлов.
 +
|iniFiles=irbisa_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Секция TEXTS (irbisa_fulltext.ini)
 +
|name=isNeedRefreshBriefText
 +
|sectionName=TEXTS
 +
|descr=В зависимости от значения этого параметра изменяется логика обновления поля 22 (первые строки текста) при создании и актуализации словаря.
 +
|iniFiles=irbisa_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Прочие параметры, касающиеся обработки текстовых файлов
 +
|name=isNeedSplitInsteadExtract
 +
|sectionName=TEXTS
 +
|descr=Этот параметр касается некоторых особенностей использования утилит по разбиению PDF-файлов на страницы.
 +
|iniFiles=irbisa_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Секция TEXTS (irbisa_fulltext.ini)
 +
|name=isSboychakovThemeDictionaryEnable
 +
|sectionName=TEXTS
 +
|descr=Управляет построением тематического словаря.
 +
|iniFiles=irbisa_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Секция TEXTS (irbisa_fulltext.ini)
 +
|name=method9_tryNotUseDirectDBAccess
 +
|sectionName=TEXTS
 +
|descr=Управляет интерпретацией ссылок на полные тексты.
 +
|iniFiles=irbisa_fulltext.ini
 +
}}
 +
 
 +
====Секция <tt>TEXTS,MAIN</tt>====
 +
 
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Местонахождение утилиты
 +
|name=DJVU2DJVU
 +
|sectionName=TEXTS,MAIN
 +
|descr=Значение этого параметра – относительный путь к файлам: <tt>djvutxt.exe</tt> (утилите, преобразующей файл в формате DJVU в текстовый формат) и <tt>djvused.exe</tt> (утилите, разбивающей файл в формате DJVU на отдельные страницы).
 +
|iniFiles=irbisa_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Прочие параметры, касающиеся обработки текстовых файлов
 +
|name=FULL_TEXT_FileNamePrefixDiv
 +
|sectionName=TEXTS,MAIN
 +
|descr=Разделитель имени файла и номера страницы, используемый для записи ссылок на полные тексты в базе данных.
 +
|iniFiles=irbisa_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Местонахождение утилиты
 +
|name=PDF2PDF
 +
|sectionName=TEXTS,MAIN
 +
|descr=Значение этого параметра – относительный путь к файлу <tt>pdf2pdf.exe</tt> (утилите, разбивающей файл в формате PDF на отдельные страницы).
 +
|iniFiles=irbisa_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Выбор утилиты
 +
|name=PDFSplitUtilityOrder
 +
|sectionName=TEXTS,MAIN
 +
|descr=Значение этого параметра задаёт очерёдность применения утилит для разбиения PDF-файлов на страницы.
 +
|iniFiles=irbisa_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Выбор утилиты
 +
|name=PDFSplitter
 +
|sectionName=TEXTS,MAIN
 +
|descr=В зависимости от значения этого параметра происходит выбор утилиты, разбивающей файл в формате PDF на отдельные страницы.
 +
|iniFiles=irbisa_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Местонахождение утилиты
 +
|name=PDFTK
 +
|sectionName=TEXTS,MAIN
 +
|descr=Значение этого параметра – относительный путь к файлу <tt>pdftk.exe</tt> (утилите, разбивающей файл в формате PDF на отдельные страницы).
 +
|iniFiles=irbisa_fulltext.ini
 +
}}
 +
 
 +
===Параметры АРМ Читатель полнотекстовых БД (<tt>irbisr_fulltext.ini</tt>)===
 +
 
 +
====Секция <tt>MAIN</tt>====
 +
 
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Секция MAIN (irbisr_fulltext.ini)
 +
|name=BriefPft
 +
|sectionName=MAIN
 +
|descr=Значение этого параметра – имя формата (без расширения), формирующего [[Отображение результатов поиска в полнотекстовой версии ИРБИС|"середину" HTML-страницы с результатами поиска]].
 +
|iniFiles=irbisr_fulltext.ini
 +
}}
 +
 
 +
====Секция <tt>SEARCHRESULTHTML</tt>====
 +
 
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Секция MAIN (irbisr_fulltext.ini)
 +
|name=IsNeedAddSomeTags
 +
|sectionName=SearchResultHTML
 +
|descr=Признак того, [[Отображение результатов поиска в полнотекстовой версии ИРБИС|составит ли АРМ Читатель для полнотекстовых баз данных HTML-страницу с результатами поиска]] исключительно из результатов работы соответствующих форматов, или же будет добавлять некоторые теги.
 +
|iniFiles=irbisr_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Секция SearchResultHTML (irbisr_fulltext.ini)
 +
|name=SearchEmpty
 +
|sectionName=SearchResultHTML
 +
|descr=Значение этого параметра – имя формата, формирующего [[Отображение результатов поиска в полнотекстовой версии ИРБИС|HTML-страницу с пустым результатом поиска]].
 +
|iniFiles=irbisr_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Секция SearchResultHTML (irbisr_fulltext.ini)
 +
|name=SearchFooter
 +
|sectionName=SearchResultHTML
 +
|descr=Значение этого параметра – имя формата (или список имён форматов, перечисленных через запятую без пробелов), формирующего [[Отображение результатов поиска в полнотекстовой версии ИРБИС|"подвал" HTML-страницы с результатами поиска]].
 +
|iniFiles=irbisr_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Секция SearchResultHTML (irbisr_fulltext.ini)
 +
|name=SearchHeader
 +
|sectionName=SearchResultHTML
 +
|descr=Значение этого параметра – имя формата (или список имён форматов, перечисленных через запятую без пробелов), формирующего [[Отображение результатов поиска в полнотекстовой версии ИРБИС|"заголовок" HTML-страницы с результатами поиска]].
 +
|iniFiles=irbisr_fulltext.ini
 +
}}
 +
 
 +
====Секция <tt>TEXTS,MAIN</tt>====
 +
 
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Местонахождение утилиты
 +
|name=DJVU2DJVU
 +
|sectionName=TEXTS,MAIN
 +
|descr=Значение этого параметра – относительный путь к файлам: <tt>djvutxt.exe</tt> (утилите, преобразующей файл в формате DJVU в текстовый формат) и <tt>djvused.exe</tt> (утилите, разбивающей файл в формате DJVU на отдельные страницы).
 +
|iniFiles=irbisr_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Прочие параметры, касающиеся обработки текстовых файлов
 +
|name=FULL_TEXT_FileNamePrefixDiv
 +
|sectionName=TEXTS,MAIN
 +
|descr=Разделитель имени файла и номера страницы, используемый для записи ссылок на полные тексты в базе данных.
 +
|iniFiles=irbisr_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Местонахождение утилиты
 +
|name=PDF2PDF
 +
|sectionName=TEXTS,MAIN
 +
|descr=Значение этого параметра – относительный путь к файлу <tt>pdf2pdf.exe</tt> (утилите, разбивающей файл в формате PDF на отдельные страницы).
 +
|iniFiles=irbisr_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Выбор утилиты
 +
|name=PDFSplitUtilityOrder
 +
|sectionName=TEXTS,MAIN
 +
|descr=Значение этого параметра задаёт очерёдность применения утилит для разбиения PDF-файлов на страницы.
 +
|iniFiles=irbisr_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Выбор утилиты
 +
|name=PDFSplitter
 +
|sectionName=TEXTS,MAIN
 +
|descr=В зависимости от значения этого параметра происходит выбор утилиты, разбивающей файл в формате PDF на отдельные страницы.
 +
|iniFiles=irbisr_fulltext.ini
 +
}}
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Местонахождение утилиты
 +
|name=PDFTK
 +
|sectionName=TEXTS,MAIN
 +
|descr=Значение этого параметра – относительный путь к файлу <tt>pdftk.exe</tt> (утилите, разбивающей файл в формате PDF на отдельные страницы).
 +
|iniFiles=irbisr_fulltext.ini
 +
}}
 +
 
 +
====Секция <tt>ИМЯ_БАЗЫ_ДАННЫХ</tt>====
 +
 
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|link=Секция с именем базы данных
 +
|name=SearchFrames
 +
|sectionName=имя_базы_данных
 +
|descr=Значение этого параметра – список имён форматов, перечисленных через запятую без пробелов, формирующих [[Отображение результатов поиска в полнотекстовой версии ИРБИС|"заголовок" и "подвал" HTML-страницы с результатами поиска]].
 +
|iniFiles=irbisr_fulltext.ini
 +
}}
 +
 
 +
 
 +
==Параметры, сгруппированные по назначению==
 +
 
 +
===Обработка текстовых файлов===
  
 
Ряд параметров имеет отношение к [[АРМ Администратор полнотекстовых БД#Особенности обработки текстовых файлов, подлежащих полнотекстовому индексированию|обработке текстовых файлов, подлежащих полнотекстовому индексированию]].
 
Ряд параметров имеет отношение к [[АРМ Администратор полнотекстовых БД#Особенности обработки текстовых файлов, подлежащих полнотекстовому индексированию|обработке текстовых файлов, подлежащих полнотекстовому индексированию]].
  
Параметры из этого ряда, применимые как для АРМ Администратор, так и для АРМ Читатель, см. в [[#Обработка текстовых файлов в АРМ Администратор и АРМ Читатель|подразделе ''Обработка текстовых файлов в АРМ Администратор и АРМ Читатель'']].
+
Параметры из этого ряда, применимые только по отношению к АРМ Администратор см. в [[#Обработка текстовых файлов АРМ Администратор|подразделе ''Обработка текстовых файлов а АРМ Администратор'']].
  
В данном подразделе рассмотрены параметры, применимые только по отношению к АРМ Администратор.
+
В данном подразделе рассмотрены параметры, применимые как для АРМ Администратор, так и для АРМ Читатель.
  
 
В конфигурационном файле [[АРМ Администратор полнотекстовых БД]] данные параметры находятся в секции <tt>TEXTS</tt>, в конфигурационном файле [[АРМ Читатель для полнотекстовых БД]] данные параметры находятся в секции <tt>MAIN</tt>.
 
В конфигурационном файле [[АРМ Администратор полнотекстовых БД]] данные параметры находятся в секции <tt>TEXTS</tt>, в конфигурационном файле [[АРМ Читатель для полнотекстовых БД]] данные параметры находятся в секции <tt>MAIN</tt>.
  
=====Местонахождение утилиты=====
+
====Местонахождение утилиты====
 +
 
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|name=PDFTK
 +
|iniFiles=irbisa_fulltext.ini,irbisr_fulltext.ini
 +
|sectionName=TEXTS,MAIN
 +
|descr=Значение этого параметра – относительный путь к файлу <tt>pdftk.exe</tt> (утилите, разбивающей файл в формате PDF на отдельные страницы).
 +
|using=Исходное значение параметра в конфигурационном файле – <tt>.\Converters\PDFTK\</tt>.
 +
|versionInfo=Параметр введён [[Отличия ИРБИС 2009.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2009.1]].
 +
}}
 +
 
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|name=PDF2PDF
 +
|iniFiles=irbisa_fulltext.ini,irbisr_fulltext.ini
 +
|sectionName=TEXTS,MAIN
 +
|descr=Значение этого параметра – относительный путь к файлу <tt>pdf2pdf.exe</tt> (утилите, разбивающей файл в формате PDF на отдельные страницы).
 +
|using=Исходное значение параметра в конфигурационном файле – <tt>.\Converters\PDF2PDF\</tt>.
 +
}}
  
 
{{Описание параметра инициализационного файла для HLPINI
 
{{Описание параметра инициализационного файла для HLPINI
Строка 36: Строка 304:
 
|descr=Значение этого параметра – относительный путь к файлу <tt>pdftotext.exe</tt> (утилите, преобразующей файл в формате PDF в текстовый формат).
 
|descr=Значение этого параметра – относительный путь к файлу <tt>pdftotext.exe</tt> (утилите, преобразующей файл в формате PDF в текстовый формат).
 
|using=Исходное значение параметра в конфигурационном файле – <tt>.\Converters\PDF2TXT\</tt>.
 
|using=Исходное значение параметра в конфигурационном файле – <tt>.\Converters\PDF2TXT\</tt>.
|sectionLevel=======
 
 
}}
 
}}
  
=====Выбор утилиты=====
+
{{Описание параметра инициализационного файла для HLPINI
 +
|name=DJVU2DJVU
 +
|iniFiles=irbisa_fulltext.ini,irbisr_fulltext.ini
 +
|sectionName=TEXTS,MAIN
 +
|descr=Значение этого параметра – относительный путь к файлам: <tt>djvutxt.exe</tt> (утилите, преобразующей файл в формате DJVU в текстовый формат) и <tt>djvused.exe</tt> (утилите, разбивающей файл в формате DJVU на отдельные страницы).
 +
|using=Исходное значение параметра в конфигурационном файле – <tt>.\Converters\djvu2djvu\</tt>.
 +
}}
 +
 
 +
====Выбор утилиты====
  
 
{{Описание параметра инициализационного файла для HLPINI
 
{{Описание параметра инициализационного файла для HLPINI
Строка 48: Строка 323:
 
|using=Возможные значения этого параметра: <tt>0</tt> – использовать утилиту <tt>docs2text.exe</tt>; <tt>1</tt> – использовать утилиту <tt>pdftotext.exe</tt>. Отсутствие параметра эквивалентно присвоению значения <tt>0</tt>. Исходное значение параметра в конфигурационном файле – <tt>1</tt>.
 
|using=Возможные значения этого параметра: <tt>0</tt> – использовать утилиту <tt>docs2text.exe</tt>; <tt>1</tt> – использовать утилиту <tt>pdftotext.exe</tt>. Отсутствие параметра эквивалентно присвоению значения <tt>0</tt>. Исходное значение параметра в конфигурационном файле – <tt>1</tt>.
 
|versionInfo=[[Отличия ИРБИС 2011.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|В версии ИРБИС 2011.1]] параметр теряет актуальность в связи с появлением параметра <tt>PDFTextExtractUtilityOrder</tt>.
 
|versionInfo=[[Отличия ИРБИС 2011.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|В версии ИРБИС 2011.1]] параметр теряет актуальность в связи с появлением параметра <tt>PDFTextExtractUtilityOrder</tt>.
|sectionLevel=======
 
 
}}
 
}}
  
Строка 57: Строка 331:
 
|descr=В зависимости от значения этого параметра происходит выбор способа извлечения текста из <tt>DOC</tt>-файлов.
 
|descr=В зависимости от значения этого параметра происходит выбор способа извлечения текста из <tt>DOC</tt>-файлов.
 
|using=Возможные значения параметра: <tt>0</tt> – использовать утилиту <tt>docs2text.exe</tt>; <tt>1</tt> – использовать программу Microsoft Word (по технологии Ole Automation). Отсутствие параметра эквивалентно присвоению значения <tt>0</tt>. Исходное значение параметра в конфигурационном файле – <tt>0</tt>.
 
|using=Возможные значения параметра: <tt>0</tt> – использовать утилиту <tt>docs2text.exe</tt>; <tt>1</tt> – использовать программу Microsoft Word (по технологии Ole Automation). Отсутствие параметра эквивалентно присвоению значения <tt>0</tt>. Исходное значение параметра в конфигурационном файле – <tt>0</tt>.
|sectionLevel=======
+
}}
 +
 
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|name=PDFSplitter
 +
|iniFiles=irbisa_fulltext.ini,irbisr_fulltext.ini
 +
|sectionName=TEXTS,MAIN
 +
|descr=В зависимости от значения этого параметра происходит выбор утилиты, разбивающей файл в формате PDF на отдельные страницы.
 +
|using=Возможные значения этого параметра: <tt>PDFTK</tt> и <tt>PDF2PDF</tt>. Отсутствие параметра эквивалентно присвоению значения <tt>PDF2PDF</tt>. Исходное значение параметра в конфигурационном файле – <tt>PDFTK</tt>.
 +
|versionInfo=Параметр введён [[Отличия ИРБИС 2009.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2009.1]]. [[Отличия ИРБИС 2011.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|В версии ИРБИС 2011.1]] параметр теряет актуальность в связи с появлением параметра <tt>PDFSplitUtilityOrder</tt>.
 +
}}
 +
 
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|name=PDFSplitUtilityOrder
 +
|iniFiles=irbisa_fulltext.ini,irbisr_fulltext.ini
 +
|sectionName=TEXTS,MAIN
 +
|descr=Значение этого параметра задаёт очерёдность применения утилит для разбиения PDF-файлов на страницы.
 +
|using=Параметр составляется из условных обозначений утилит, перечисленных через запятую. Допустимые обозначения утилит: <tt>PDF2PDF</tt> – утилита <tt>PDF2PDF.exe</tt>; <tt>PDFTK</tt> – утилита <tt>PDFTK.exe</tt>. При наличии <tt>PDFSplitUtilityOrder</tt> значение параметра <tt>PDFSplitter</tt> не играет роли; при отсутствии <tt>PDFSplitUtilityOrder</tt> используется утилита, соответствующая значению параметра <tt>PDFSplitter</tt>. Исходное значение параметра в конфигурационном файле – <tt>PDFTK,PDF2PDF</tt>.
 +
|versionInfo=Параметр введён [[Отличия ИРБИС 2011.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2011.1]].
 
}}
 
}}
  
Строка 67: Строка 358:
 
|using=Параметр составляется из условных обозначений утилит, перечисленных через запятую. Допустимые обозначения утилит: <tt>PDFToText</tt> – утилита <tt>pdftotext.exe</tt>; <tt>Docs2Text</tt> – утилита <tt>docs2text.exe</tt>. При наличии <tt>PDFTextExtractUtilityOrder</tt> значение параметра <tt>Converter_PDF</tt> не играет роли; при отсутствии <tt>PDFTextExtractUtilityOrder</tt> используется утилита, соответствующая значению параметра <tt>Converter_PDF</tt>. Исходное значение параметра в конфигурационном файле – <tt>PDFToText,Docs2Text</tt>.
 
|using=Параметр составляется из условных обозначений утилит, перечисленных через запятую. Допустимые обозначения утилит: <tt>PDFToText</tt> – утилита <tt>pdftotext.exe</tt>; <tt>Docs2Text</tt> – утилита <tt>docs2text.exe</tt>. При наличии <tt>PDFTextExtractUtilityOrder</tt> значение параметра <tt>Converter_PDF</tt> не играет роли; при отсутствии <tt>PDFTextExtractUtilityOrder</tt> используется утилита, соответствующая значению параметра <tt>Converter_PDF</tt>. Исходное значение параметра в конфигурационном файле – <tt>PDFToText,Docs2Text</tt>.
 
|versionInfo=Параметр введён [[Отличия ИРБИС 2011.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2011.1]].
 
|versionInfo=Параметр введён [[Отличия ИРБИС 2011.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2011.1]].
|sectionLevel=======
 
 
}}
 
}}
  
=====Защищённые PDF=====
+
====Защищённые PDF====
  
 
{{Описание параметра инициализационного файла для HLPINI
 
{{Описание параметра инициализационного файла для HLPINI
Строка 79: Строка 369:
 
|using=Возможные значения этого параметра: <tt>0</tt> – не снимать защиту; <tt>1</tt> – снимать защиту в процессе индексирования. Отсутствие параметра эквивалентно присвоению значения <tt>0</tt>. Исходное значение параметра в конфигурационном файле – <tt>0</tt>. Для снятия защиты используется пароль, указанный в параметре <tt>PDFPassword</tt>.
 
|using=Возможные значения этого параметра: <tt>0</tt> – не снимать защиту; <tt>1</tt> – снимать защиту в процессе индексирования. Отсутствие параметра эквивалентно присвоению значения <tt>0</tt>. Исходное значение параметра в конфигурационном файле – <tt>0</tt>. Для снятия защиты используется пароль, указанный в параметре <tt>PDFPassword</tt>.
 
|versionInfo=Параметр введён [[Отличия ИРБИС 2012.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2012.1]].
 
|versionInfo=Параметр введён [[Отличия ИРБИС 2012.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2012.1]].
|sectionLevel=======
 
 
}}
 
}}
  
Строка 89: Строка 378:
 
|using=Данный параметр используется в связке с параметром <tt>isNeedDecryptPDF</tt>.
 
|using=Данный параметр используется в связке с параметром <tt>isNeedDecryptPDF</tt>.
 
|versionInfo=Параметр введён [[Отличия ИРБИС 2012.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2012.1]].
 
|versionInfo=Параметр введён [[Отличия ИРБИС 2012.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2012.1]].
|sectionLevel=======
 
 
}}
 
}}
  
=====Прочие параметры, касающиеся обработки текстовых файлов=====
+
====Прочие параметры, касающиеся обработки текстовых файлов====
 +
 
 +
{{Описание параметра инициализационного файла для HLPINI
 +
|name=FULL_TEXT_FileNamePrefixDiv
 +
|iniFiles=irbisa_fulltext.ini,irbisr_fulltext.ini
 +
|sectionName=TEXTS,MAIN
 +
|descr=Разделитель имени файла и номера страницы, используемый для записи ссылок на полные тексты в базе данных.
 +
|using=Отсутствие параметра эквивалентно присвоению значения <tt>__</tt>. Исходное значение параметра в конфигурационном файле – <tt>__</tt>.
 +
}}
  
 
{{Описание параметра инициализационного файла для HLPINI
 
{{Описание параметра инициализационного файла для HLPINI
Строка 101: Строка 397:
 
|using=Значение этого параметра определяет, как будет происходить получение страницы из PDF-файла при обработке ссылки на страницу. Возможные значения параметра: <tt>0</tt> – извлекать одну конкретную страницу; <tt>0</tt> – извлекать скопом все страницы из PDF-файла одной командой утилите. Отсутствие параметра эквивалентно присвоению значения <tt>1</tt>. В исходном варианте параметр отсутствует в конфигурационном файле.
 
|using=Значение этого параметра определяет, как будет происходить получение страницы из PDF-файла при обработке ссылки на страницу. Возможные значения параметра: <tt>0</tt> – извлекать одну конкретную страницу; <tt>0</tt> – извлекать скопом все страницы из PDF-файла одной командой утилите. Отсутствие параметра эквивалентно присвоению значения <tt>1</tt>. В исходном варианте параметр отсутствует в конфигурационном файле.
 
|versionInfo=Параметр введён [[Отличия ИРБИС 2012.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2012.1]].
 
|versionInfo=Параметр введён [[Отличия ИРБИС 2012.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2012.1]].
|sectionLevel=======
 
 
}}
 
}}
  
Строка 115: Строка 410:
 
|using=Отсутствие параметра эквивалентно присвоению значения <tt>100</tt>. Исходное значение параметра в конфигурационном файле – <tt>100</tt>.
 
|using=Отсутствие параметра эквивалентно присвоению значения <tt>100</tt>. Исходное значение параметра в конфигурационном файле – <tt>100</tt>.
 
|versionInfo=Параметр введён [[Отличия ИРБИС 2012.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2012.1]].
 
|versionInfo=Параметр введён [[Отличия ИРБИС 2012.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2012.1]].
|sectionLevel=======
 
 
}}
 
}}
  
====Прочие параметры секции <tt>TEXTS</tt>====
+
===Параметры АРМ Администратор полнотекстовых БД===
 +
 
 +
====Секция TEXTS (irbisa_fulltext.ini)====
  
 
{{Описание параметра инициализационного файла для HLPINI
 
{{Описание параметра инициализационного файла для HLPINI
Строка 127: Строка 423:
 
|using=Возможные значения этого параметра: <tt>0</tt> – не обновлять, если в поле уже есть текст; <tt>1</tt> – обновлять поле безусловно. Отсутствие параметра эквивалентно присвоению значения <tt>1</tt>. Исходное значение параметра в конфигурационном файле – <tt>1</tt>.
 
|using=Возможные значения этого параметра: <tt>0</tt> – не обновлять, если в поле уже есть текст; <tt>1</tt> – обновлять поле безусловно. Отсутствие параметра эквивалентно присвоению значения <tt>1</tt>. Исходное значение параметра в конфигурационном файле – <tt>1</tt>.
 
|versionInfo=Параметр введён [[Отличия ИРБИС 2011.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2011.1]].
 
|versionInfo=Параметр введён [[Отличия ИРБИС 2011.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2011.1]].
|sectionLevel======
 
 
}}
 
}}
  
Строка 137: Строка 432:
 
|using=Возможные значения этого параметра: <tt>0</tt> – не строить тематический словарь; <tt>1</tt> – строить тематический словарь. Отсутствие параметра эквивалентно присвоению значения <tt>0</tt>. Исходное значение параметра в конфигурационном файле – <tt>0</tt>.
 
|using=Возможные значения этого параметра: <tt>0</tt> – не строить тематический словарь; <tt>1</tt> – строить тематический словарь. Отсутствие параметра эквивалентно присвоению значения <tt>0</tt>. Исходное значение параметра в конфигурационном файле – <tt>0</tt>.
 
|versionInfo=Параметр введён [[Отличия ИРБИС 2011.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2011.1]].
 
|versionInfo=Параметр введён [[Отличия ИРБИС 2011.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2011.1]].
|sectionLevel======
 
 
}}
 
}}
  
Строка 149: Строка 443:
 
|using=Включение данного параметра значит, что требуется в 9 методе ТВП по возможности не использовать непосредственное чтение ссылки на текст из БД. Это возможно, если соответствующий элемент (результат работы формата в ТВП) является ссылкой на полный текст в формате БД, предварённой префиксом "FT-DB-LNK:". При этом параметр FULL_TEXT_Name не используется. Если нет возможности не использовать непосредственное чтение ссылки на текст из БД, то работает старый алгоритм (новая реализация старого алгоритма). Если значение параметра method9_tryNotUseDirectDBAccess=0, то работает старый алгоритм (старая реализация старого алгоритма). Отсутствие параметра эквивалентно присвоению значения <tt>0</tt>. Исходное значение параметра в конфигурационном файле – <tt>0</tt>.
 
|using=Включение данного параметра значит, что требуется в 9 методе ТВП по возможности не использовать непосредственное чтение ссылки на текст из БД. Это возможно, если соответствующий элемент (результат работы формата в ТВП) является ссылкой на полный текст в формате БД, предварённой префиксом "FT-DB-LNK:". При этом параметр FULL_TEXT_Name не используется. Если нет возможности не использовать непосредственное чтение ссылки на текст из БД, то работает старый алгоритм (новая реализация старого алгоритма). Если значение параметра method9_tryNotUseDirectDBAccess=0, то работает старый алгоритм (старая реализация старого алгоритма). Отсутствие параметра эквивалентно присвоению значения <tt>0</tt>. Исходное значение параметра в конфигурационном файле – <tt>0</tt>.
 
|versionInfo=Параметр введён [[Отличия ИРБИС 2012.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2012.1]].
 
|versionInfo=Параметр введён [[Отличия ИРБИС 2012.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2012.1]].
|sectionLevel======
 
 
}}
 
}}
  
===Секция <tt>ABBY</tt>===
+
====Секция ABBY (irbisa_fulltext.ini)====
  
 
Секция <tt>ABBY</tt> имеет отношение [[АРМ Администратор#Версии АРМ Администратор|только к '''АРМ Администратор полнотекстовых БД''']], и используется при создании имидж-каталога.
 
Секция <tt>ABBY</tt> имеет отношение [[АРМ Администратор#Версии АРМ Администратор|только к '''АРМ Администратор полнотекстовых БД''']], и используется при создании имидж-каталога.
Строка 179: Строка 472:
 
}}
 
}}
  
==Параметры АРМ Читатель для полнотекстовых БД==
+
===Параметры АРМ Читатель для полнотекстовых БД===
  
===Секция с именем базы данных===
+
====Секция с именем базы данных====
  
 
В секции с именем базы данных содержаться параметры, относящиеся только к данной базе.
 
В секции с именем базы данных содержаться параметры, относящиеся только к данной базе.
Строка 193: Строка 486:
 
}}
 
}}
  
===Секция <tt>MAIN</tt>===
+
====Секция MAIN (irbisr_fulltext.ini)====
  
 
В секции <tt>MAIN</tt> присутствует ряд параметров, определяющих обработку файлов полных текстов. Описание данных параметров см. [[#Конфигурационные параметры, определяющие обработку файлов полных текстов|в подразделе ''Конфигурационные параметры, определяющие обработку файлов полных текстов'']]
 
В секции <tt>MAIN</tt> присутствует ряд параметров, определяющих обработку файлов полных текстов. Описание данных параметров см. [[#Конфигурационные параметры, определяющие обработку файлов полных текстов|в подразделе ''Конфигурационные параметры, определяющие обработку файлов полных текстов'']]
Строка 214: Строка 507:
 
}}
 
}}
  
===Секция <tt>SearchResultHTML</tt>===
+
====Секция SearchResultHTML (irbisr_fulltext.ini)====
  
 
{{Описание параметра инициализационного файла для HLPINI
 
{{Описание параметра инициализационного файла для HLPINI
Строка 239: Строка 532:
 
|using=При отсутствии данного параметра и параметра <tt>SearchFooter</tt> используется значение параметра <tt>SearchFrames</tt> из секции соответствующей базы данных. В исходном варианте параметр отсутствует в конфигурационном файле.  
 
|using=При отсутствии данного параметра и параметра <tt>SearchFooter</tt> используется значение параметра <tt>SearchFrames</tt> из секции соответствующей базы данных. В исходном варианте параметр отсутствует в конфигурационном файле.  
 
}}
 
}}
 
==Параметры АРМ Администратор полнотекстовых БД и АРМ Читатель для полнотекстовых БД==
 
 
===Обработка текстовых файлов в АРМ Администратор и АРМ Читатель===
 
 
Ряд параметров имеет отношение к [[АРМ Администратор полнотекстовых БД#Особенности обработки текстовых файлов, подлежащих полнотекстовому индексированию|обработке текстовых файлов, подлежащих полнотекстовому индексированию]].
 
 
Параметры из этого ряда, применимые только по отношению к АРМ Администратор см. в [[#Обработка текстовых файлов АРМ Администратор|подразделе ''Обработка текстовых файлов а АРМ Администратор'']].
 
 
В данном подразделе рассмотрены параметры, применимые как для АРМ Администратор, так и для АРМ Читатель.
 
 
В конфигурационном файле [[АРМ Администратор полнотекстовых БД]] данные параметры находятся в секции <tt>TEXTS</tt>, в конфигурационном файле [[АРМ Читатель для полнотекстовых БД]] данные параметры находятся в секции <tt>MAIN</tt>.
 
 
====Местонахождение утилиты====
 
 
{{Описание параметра инициализационного файла для HLPINI
 
|name=PDFTK
 
|iniFiles=irbisa_fulltext.ini,irbisr_fulltext.ini
 
|sectionName=TEXTS,MAIN
 
|descr=Значение этого параметра – относительный путь к файлу <tt>pdftk.exe</tt> (утилите, разбивающей файл в формате PDF на отдельные страницы).
 
|using=Исходное значение параметра в конфигурационном файле – <tt>.\Converters\PDFTK\</tt>.
 
|versionInfo=Параметр введён [[Отличия ИРБИС 2009.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2009.1]].
 
|sectionLevel======
 
}}
 
 
{{Описание параметра инициализационного файла для HLPINI
 
|name=PDF2PDF
 
|iniFiles=irbisa_fulltext.ini,irbisr_fulltext.ini
 
|sectionName=TEXTS,MAIN
 
|descr=Значение этого параметра – относительный путь к файлу <tt>pdf2pdf.exe</tt> (утилите, разбивающей файл в формате PDF на отдельные страницы).
 
|using=Исходное значение параметра в конфигурационном файле – <tt>.\Converters\PDF2PDF\</tt>.
 
|sectionLevel======
 
}}
 
 
{{Описание параметра инициализационного файла для HLPINI
 
|name=DJVU2DJVU
 
|iniFiles=irbisa_fulltext.ini,irbisr_fulltext.ini
 
|sectionName=TEXTS,MAIN
 
|descr=Значение этого параметра – относительный путь к файлам: <tt>djvutxt.exe</tt> (утилите, преобразующей файл в формате DJVU в текстовый формат) и <tt>djvused.exe</tt> (утилите, разбивающей файл в формате DJVU на отдельные страницы).
 
|using=Исходное значение параметра в конфигурационном файле – <tt>.\Converters\djvu2djvu\</tt>.
 
|sectionLevel======
 
}}
 
 
====Выбор утилиты====
 
 
{{Описание параметра инициализационного файла для HLPINI
 
|name=PDFSplitter
 
|iniFiles=irbisa_fulltext.ini,irbisr_fulltext.ini
 
|sectionName=TEXTS,MAIN
 
|descr=В зависимости от значения этого параметра происходит выбор утилиты, разбивающей файл в формате PDF на отдельные страницы.
 
|using=Возможные значения этого параметра: <tt>PDFTK</tt> и <tt>PDF2PDF</tt>. Отсутствие параметра эквивалентно присвоению значения <tt>PDF2PDF</tt>. Исходное значение параметра в конфигурационном файле – <tt>PDFTK</tt>.
 
|versionInfo=Параметр введён [[Отличия ИРБИС 2009.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2009.1]]. [[Отличия ИРБИС 2011.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|В версии ИРБИС 2011.1]] параметр теряет актуальность в связи с появлением параметра <tt>PDFSplitUtilityOrder</tt>.
 
|sectionLevel======
 
}}
 
 
{{Описание параметра инициализационного файла для HLPINI
 
|name=PDFSplitUtilityOrder
 
|iniFiles=irbisa_fulltext.ini,irbisr_fulltext.ini
 
|sectionName=TEXTS,MAIN
 
|descr=Значение этого параметра задаёт очерёдность применения утилит для разбиения PDF-файлов на страницы.
 
|using=Параметр составляется из условных обозначений утилит, перечисленных через запятую. Допустимые обозначения утилит: <tt>PDF2PDF</tt> – утилита <tt>PDF2PDF.exe</tt>; <tt>PDFTK</tt> – утилита <tt>PDFTK.exe</tt>. При наличии <tt>PDFSplitUtilityOrder</tt> значение параметра <tt>PDFSplitter</tt> не играет роли; при отсутствии <tt>PDFSplitUtilityOrder</tt> используется утилита, соответствующая значению параметра <tt>PDFSplitter</tt>. Исходное значение параметра в конфигурационном файле – <tt>PDFTK,PDF2PDF</tt>.
 
|versionInfo=Параметр введён [[Отличия ИРБИС 2011.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|в версии ИРБИС 2011.1]].
 
|sectionLevel======
 
}}
 
 
====Прочие параметры, касающиеся обработки текстовых файлов====
 
 
{{Описание параметра инициализационного файла для HLPINI
 
|name=FULL_TEXT_FileNamePrefixDiv
 
|iniFiles=irbisa_fulltext.ini,irbisr_fulltext.ini
 
|sectionName=TEXTS,MAIN
 
|descr=Разделитель имени файла и номера страницы, используемый для записи ссылок на полные тексты в базе данных.
 
|using=Отсутствие параметра эквивалентно присвоению значения <tt>__</tt>. Исходное значение параметра в конфигурационном файле – <tt>__</tt>.
 
|sectionLevel======
 
}}
 
 
  
 
==Ссылки==
 
==Ссылки==

Версия 22:53, 22 мая 2013

В данной статье описаны конфигурационные параметры, специфичные для программных продуктов ИРБИС 64 для полнотекстовых баз данных и соответствующих конфигурационных файлов:

Эти конфигурационные файлы являются стандартными ini-файлами и состоят из набора секций.

Описание конфигурационных параметров для Веб-шлюза ИРБИС для полнотекстовых БД см. в документе Техническая документация WEB ИРБИС64 и WEB ИРБИС32 актуальная версия которого доступна на форуме.

Принятый формат записи параметров, указывающих местонахождение на файловой системе

Обычно эти параметры представляют собой относительный путь, начинающийся со знака "." (со знака точка). Знак точка обозначает местонахождение исполняемого файла, использующего данный конфигурационный файл.

Например, параметр PDFTK содержит относительный путь к файлу pdftk.exe, и в качестве исходного имеет следующее значение:

.\Converters\PDFTK\

Параметры, сгруппированные по АРМ

Параметры АРМ Администратор полнотекстовых БД (irbisa_fulltext.ini)

Секция ABBY


DeveloperSN
irbisa_fulltext.ini, секция ABBY
Назначение: Серийный номер, указанный на USB-ключе.
Подробнее об использовании параметра см. в подразделе Секция ABBY (irbisa_fulltext.ini).

EngineDllPath
irbisa_fulltext.ini, секция ABBY
Назначение: Полный путь к библиотеке FREngine.dll.
Подробнее об использовании параметра см. в подразделе Секция ABBY (irbisa_fulltext.ini).

FR_LANGUAGES
irbisa_fulltext.ini, секция ABBY
Назначение: Cписок предполагаемых языков, используемый при распознавании.
Подробнее об использовании параметра см. в подразделе Секция ABBY (irbisa_fulltext.ini).

Секция TEXTS


Converter_PDF
irbisa_fulltext.ini, секция TEXTS
Назначение: В зависимости от значения этого параметра происходит выбор утилиты, преобразующей файл в формате PDF в текстовый формат.
Подробнее об использовании параметра см. в подразделе Выбор утилиты.

Converter_Word
irbisa_fulltext.ini, секция TEXTS
Назначение: В зависимости от значения этого параметра происходит выбор способа извлечения текста из DOC-файлов.
Подробнее об использовании параметра см. в подразделе Выбор утилиты.

MAX_TIME_CONVERTING
irbisa_fulltext.ini, секция TEXTS
Назначение: Задаёт максимальное время работы (в секундах) утилит, выполняющих извлечение текста и извлечение страниц из полнотекстовых документов. Это бывает необходимо в некоторых случаях, когда не хватает отведённого времени.
Подробнее об использовании параметра см. в подразделе Прочие параметры, касающиеся обработки текстовых файлов.

PDF2TXT
irbisa_fulltext.ini, секция TEXTS
Назначение: Значение этого параметра – относительный путь к файлу pdftotext.exe (утилите, преобразующей файл в формате PDF в текстовый формат).
Подробнее об использовании параметра см. в подразделе Местонахождение утилиты.

PDFPassword
irbisa_fulltext.ini, секция TEXTS
Назначение: Пароль, с помощью которого защищены PDF-файлы.
Подробнее об использовании параметра см. в подразделе Защищённые PDF.

PDFTextExtractUtilityOrder
irbisa_fulltext.ini, секция TEXTS
Назначение: Значение этого параметра задаёт очерёдность применения утилит для извлечения текста из PDF-файлов.
Подробнее об использовании параметра см. в подразделе Выбор утилиты.

isNeedDecryptPDF
irbisa_fulltext.ini, секция TEXTS
Назначение: Признак использования защищённых PDF-файлов.
Подробнее об использовании параметра см. в подразделе Защищённые PDF.

isNeedRefreshBriefText
irbisa_fulltext.ini, секция TEXTS
Назначение: В зависимости от значения этого параметра изменяется логика обновления поля 22 (первые строки текста) при создании и актуализации словаря.
Подробнее об использовании параметра см. в подразделе Секция TEXTS (irbisa_fulltext.ini).

isNeedSplitInsteadExtract
irbisa_fulltext.ini, секция TEXTS
Назначение: Этот параметр касается некоторых особенностей использования утилит по разбиению PDF-файлов на страницы.
Подробнее об использовании параметра см. в подразделе Прочие параметры, касающиеся обработки текстовых файлов.

isSboychakovThemeDictionaryEnable
irbisa_fulltext.ini, секция TEXTS
Назначение: Управляет построением тематического словаря.
Подробнее об использовании параметра см. в подразделе Секция TEXTS (irbisa_fulltext.ini).

method9_tryNotUseDirectDBAccess
irbisa_fulltext.ini, секция TEXTS
Назначение: Управляет интерпретацией ссылок на полные тексты.
Подробнее об использовании параметра см. в подразделе Секция TEXTS (irbisa_fulltext.ini).

Секция TEXTS,MAIN


DJVU2DJVU
irbisa_fulltext.ini, секция TEXTS,MAIN
Назначение: Значение этого параметра – относительный путь к файлам: djvutxt.exe (утилите, преобразующей файл в формате DJVU в текстовый формат) и djvused.exe (утилите, разбивающей файл в формате DJVU на отдельные страницы).
Подробнее об использовании параметра см. в подразделе Местонахождение утилиты.

FULL_TEXT_FileNamePrefixDiv
irbisa_fulltext.ini, секция TEXTS,MAIN
Назначение: Разделитель имени файла и номера страницы, используемый для записи ссылок на полные тексты в базе данных.
Подробнее об использовании параметра см. в подразделе Прочие параметры, касающиеся обработки текстовых файлов.

PDF2PDF
irbisa_fulltext.ini, секция TEXTS,MAIN
Назначение: Значение этого параметра – относительный путь к файлу pdf2pdf.exe (утилите, разбивающей файл в формате PDF на отдельные страницы).
Подробнее об использовании параметра см. в подразделе Местонахождение утилиты.

PDFSplitUtilityOrder
irbisa_fulltext.ini, секция TEXTS,MAIN
Назначение: Значение этого параметра задаёт очерёдность применения утилит для разбиения PDF-файлов на страницы.
Подробнее об использовании параметра см. в подразделе Выбор утилиты.

PDFSplitter
irbisa_fulltext.ini, секция TEXTS,MAIN
Назначение: В зависимости от значения этого параметра происходит выбор утилиты, разбивающей файл в формате PDF на отдельные страницы.
Подробнее об использовании параметра см. в подразделе Выбор утилиты.

PDFTK
irbisa_fulltext.ini, секция TEXTS,MAIN
Назначение: Значение этого параметра – относительный путь к файлу pdftk.exe (утилите, разбивающей файл в формате PDF на отдельные страницы).
Подробнее об использовании параметра см. в подразделе Местонахождение утилиты.

Параметры АРМ Читатель полнотекстовых БД (irbisr_fulltext.ini)

Секция MAIN


BriefPft
irbisr_fulltext.ini, секция MAIN
Назначение: Значение этого параметра – имя формата (без расширения), формирующего "середину" HTML-страницы с результатами поиска.
Подробнее об использовании параметра см. в подразделе Секция MAIN (irbisr_fulltext.ini).

Секция SEARCHRESULTHTML


IsNeedAddSomeTags
irbisr_fulltext.ini, секция SearchResultHTML
Назначение: Признак того, составит ли АРМ Читатель для полнотекстовых баз данных HTML-страницу с результатами поиска исключительно из результатов работы соответствующих форматов, или же будет добавлять некоторые теги.
Подробнее об использовании параметра см. в подразделе Секция MAIN (irbisr_fulltext.ini).

SearchEmpty
irbisr_fulltext.ini, секция SearchResultHTML
Назначение: Значение этого параметра – имя формата, формирующего HTML-страницу с пустым результатом поиска.
Подробнее об использовании параметра см. в подразделе Секция SearchResultHTML (irbisr_fulltext.ini).

SearchFooter
irbisr_fulltext.ini, секция SearchResultHTML
Назначение: Значение этого параметра – имя формата (или список имён форматов, перечисленных через запятую без пробелов), формирующего "подвал" HTML-страницы с результатами поиска.
Подробнее об использовании параметра см. в подразделе Секция SearchResultHTML (irbisr_fulltext.ini).

SearchHeader
irbisr_fulltext.ini, секция SearchResultHTML
Назначение: Значение этого параметра – имя формата (или список имён форматов, перечисленных через запятую без пробелов), формирующего "заголовок" HTML-страницы с результатами поиска.
Подробнее об использовании параметра см. в подразделе Секция SearchResultHTML (irbisr_fulltext.ini).

Секция TEXTS,MAIN


DJVU2DJVU
irbisr_fulltext.ini, секция TEXTS,MAIN
Назначение: Значение этого параметра – относительный путь к файлам: djvutxt.exe (утилите, преобразующей файл в формате DJVU в текстовый формат) и djvused.exe (утилите, разбивающей файл в формате DJVU на отдельные страницы).
Подробнее об использовании параметра см. в подразделе Местонахождение утилиты.

FULL_TEXT_FileNamePrefixDiv
irbisr_fulltext.ini, секция TEXTS,MAIN
Назначение: Разделитель имени файла и номера страницы, используемый для записи ссылок на полные тексты в базе данных.
Подробнее об использовании параметра см. в подразделе Прочие параметры, касающиеся обработки текстовых файлов.

PDF2PDF
irbisr_fulltext.ini, секция TEXTS,MAIN
Назначение: Значение этого параметра – относительный путь к файлу pdf2pdf.exe (утилите, разбивающей файл в формате PDF на отдельные страницы).
Подробнее об использовании параметра см. в подразделе Местонахождение утилиты.

PDFSplitUtilityOrder
irbisr_fulltext.ini, секция TEXTS,MAIN
Назначение: Значение этого параметра задаёт очерёдность применения утилит для разбиения PDF-файлов на страницы.
Подробнее об использовании параметра см. в подразделе Выбор утилиты.

PDFSplitter
irbisr_fulltext.ini, секция TEXTS,MAIN
Назначение: В зависимости от значения этого параметра происходит выбор утилиты, разбивающей файл в формате PDF на отдельные страницы.
Подробнее об использовании параметра см. в подразделе Выбор утилиты.

PDFTK
irbisr_fulltext.ini, секция TEXTS,MAIN
Назначение: Значение этого параметра – относительный путь к файлу pdftk.exe (утилите, разбивающей файл в формате PDF на отдельные страницы).
Подробнее об использовании параметра см. в подразделе Местонахождение утилиты.

Секция ИМЯ_БАЗЫ_ДАННЫХ


SearchFrames
irbisr_fulltext.ini, секция имя_базы_данных
Назначение: Значение этого параметра – список имён форматов, перечисленных через запятую без пробелов, формирующих "заголовок" и "подвал" HTML-страницы с результатами поиска.
Подробнее об использовании параметра см. в подразделе Секция с именем базы данных.


Параметры, сгруппированные по назначению

Обработка текстовых файлов

Ряд параметров имеет отношение к обработке текстовых файлов, подлежащих полнотекстовому индексированию.

Параметры из этого ряда, применимые только по отношению к АРМ Администратор см. в подразделе Обработка текстовых файлов а АРМ Администратор.

В данном подразделе рассмотрены параметры, применимые как для АРМ Администратор, так и для АРМ Читатель.

В конфигурационном файле АРМ Администратор полнотекстовых БД данные параметры находятся в секции TEXTS, в конфигурационном файле АРМ Читатель для полнотекстовых БД данные параметры находятся в секции MAIN.

Местонахождение утилиты


PDFTK
irbisa_fulltext.ini,irbisr_fulltext.ini, секция TEXTS,MAIN
Назначение: Значение этого параметра – относительный путь к файлу pdftk.exe (утилите, разбивающей файл в формате PDF на отдельные страницы).
Использование: Исходное значение параметра в конфигурационном файле – .\Converters\PDFTK\.
Информация о версиях: Параметр введён в версии ИРБИС 2009.1.

PDF2PDF
irbisa_fulltext.ini,irbisr_fulltext.ini, секция TEXTS,MAIN
Назначение: Значение этого параметра – относительный путь к файлу pdf2pdf.exe (утилите, разбивающей файл в формате PDF на отдельные страницы).
Использование: Исходное значение параметра в конфигурационном файле – .\Converters\PDF2PDF\.

PDF2TXT
irbisa_fulltext.ini, секция TEXTS
Назначение: Значение этого параметра – относительный путь к файлу pdftotext.exe (утилите, преобразующей файл в формате PDF в текстовый формат).
Использование: Исходное значение параметра в конфигурационном файле – .\Converters\PDF2TXT\.

DJVU2DJVU
irbisa_fulltext.ini,irbisr_fulltext.ini, секция TEXTS,MAIN
Назначение: Значение этого параметра – относительный путь к файлам: djvutxt.exe (утилите, преобразующей файл в формате DJVU в текстовый формат) и djvused.exe (утилите, разбивающей файл в формате DJVU на отдельные страницы).
Использование: Исходное значение параметра в конфигурационном файле – .\Converters\djvu2djvu\.

Выбор утилиты


Converter_PDF
irbisa_fulltext.ini, секция TEXTS
Назначение: В зависимости от значения этого параметра происходит выбор утилиты, преобразующей файл в формате PDF в текстовый формат.
Использование: Возможные значения этого параметра: 0 – использовать утилиту docs2text.exe; 1 – использовать утилиту pdftotext.exe. Отсутствие параметра эквивалентно присвоению значения 0. Исходное значение параметра в конфигурационном файле – 1.
Информация о версиях: В версии ИРБИС 2011.1 параметр теряет актуальность в связи с появлением параметра PDFTextExtractUtilityOrder.

Converter_Word
irbisa_fulltext.ini, секция TEXTS
Назначение: В зависимости от значения этого параметра происходит выбор способа извлечения текста из DOC-файлов.
Использование: Возможные значения параметра: 0 – использовать утилиту docs2text.exe; 1 – использовать программу Microsoft Word (по технологии Ole Automation). Отсутствие параметра эквивалентно присвоению значения 0. Исходное значение параметра в конфигурационном файле – 0.

PDFSplitter
irbisa_fulltext.ini,irbisr_fulltext.ini, секция TEXTS,MAIN
Назначение: В зависимости от значения этого параметра происходит выбор утилиты, разбивающей файл в формате PDF на отдельные страницы.
Использование: Возможные значения этого параметра: PDFTK и PDF2PDF. Отсутствие параметра эквивалентно присвоению значения PDF2PDF. Исходное значение параметра в конфигурационном файле – PDFTK.
Информация о версиях: Параметр введён в версии ИРБИС 2009.1. В версии ИРБИС 2011.1 параметр теряет актуальность в связи с появлением параметра PDFSplitUtilityOrder.

PDFSplitUtilityOrder
irbisa_fulltext.ini,irbisr_fulltext.ini, секция TEXTS,MAIN
Назначение: Значение этого параметра задаёт очерёдность применения утилит для разбиения PDF-файлов на страницы.
Использование: Параметр составляется из условных обозначений утилит, перечисленных через запятую. Допустимые обозначения утилит: PDF2PDF – утилита PDF2PDF.exe; PDFTK – утилита PDFTK.exe. При наличии PDFSplitUtilityOrder значение параметра PDFSplitter не играет роли; при отсутствии PDFSplitUtilityOrder используется утилита, соответствующая значению параметра PDFSplitter. Исходное значение параметра в конфигурационном файле – PDFTK,PDF2PDF.
Информация о версиях: Параметр введён в версии ИРБИС 2011.1.

PDFTextExtractUtilityOrder
irbisa_fulltext.ini, секция TEXTS
Назначение: Значение этого параметра задаёт очерёдность применения утилит для извлечения текста из PDF-файлов.
Использование: Параметр составляется из условных обозначений утилит, перечисленных через запятую. Допустимые обозначения утилит: PDFToText – утилита pdftotext.exe; Docs2Text – утилита docs2text.exe. При наличии PDFTextExtractUtilityOrder значение параметра Converter_PDF не играет роли; при отсутствии PDFTextExtractUtilityOrder используется утилита, соответствующая значению параметра Converter_PDF. Исходное значение параметра в конфигурационном файле – PDFToText,Docs2Text.
Информация о версиях: Параметр введён в версии ИРБИС 2011.1.

Защищённые PDF


isNeedDecryptPDF
irbisa_fulltext.ini, секция TEXTS
Назначение: Признак использования защищённых PDF-файлов.
Использование: Возможные значения этого параметра: 0 – не снимать защиту; 1 – снимать защиту в процессе индексирования. Отсутствие параметра эквивалентно присвоению значения 0. Исходное значение параметра в конфигурационном файле – 0. Для снятия защиты используется пароль, указанный в параметре PDFPassword.
Информация о версиях: Параметр введён в версии ИРБИС 2012.1.

PDFPassword
irbisa_fulltext.ini, секция TEXTS
Назначение: Пароль, с помощью которого защищены PDF-файлы.
Использование: Данный параметр используется в связке с параметром isNeedDecryptPDF.
Информация о версиях: Параметр введён в версии ИРБИС 2012.1.

Прочие параметры, касающиеся обработки текстовых файлов


FULL_TEXT_FileNamePrefixDiv
irbisa_fulltext.ini,irbisr_fulltext.ini, секция TEXTS,MAIN
Назначение: Разделитель имени файла и номера страницы, используемый для записи ссылок на полные тексты в базе данных.
Использование: Отсутствие параметра эквивалентно присвоению значения __. Исходное значение параметра в конфигурационном файле – __.

isNeedSplitInsteadExtract
irbisa_fulltext.ini, секция TEXTS
Назначение: Этот параметр касается некоторых особенностей использования утилит по разбиению PDF-файлов на страницы.
Использование: Значение этого параметра определяет, как будет происходить получение страницы из PDF-файла при обработке ссылки на страницу. Возможные значения параметра: 0 – извлекать одну конкретную страницу; 0 – извлекать скопом все страницы из PDF-файла одной командой утилите. Отсутствие параметра эквивалентно присвоению значения 1. В исходном варианте параметр отсутствует в конфигурационном файле.
Информация о версиях: Параметр введён в версии ИРБИС 2012.1.

Время извлечения всех страниц скопом может быть значительно меньше времени извлечения каждой страницы, особенно это заметно на больших файлах. Благодаря механизму хранения извлечённых страниц, соответствующие страницы будут использованы, когда дойдёт очередь до их обработки. Поскольку, в большинстве случаев необходимо обработать все страницы PDF-документов, эффективнее использовать значение параметра 1.

Примечание: используемая утилита по извлечению страниц из DJVU-файлов не имеет соответствующей операции по извлечению страниц скопом, поэтому к DJVU-файлам данная логика не применима.


MAX_TIME_CONVERTING
irbisa_fulltext.ini, секция TEXTS
Назначение: Задаёт максимальное время работы (в секундах) утилит, выполняющих извлечение текста и извлечение страниц из полнотекстовых документов. Это бывает необходимо в некоторых случаях, когда не хватает отведённого времени.
Использование: Отсутствие параметра эквивалентно присвоению значения 100. Исходное значение параметра в конфигурационном файле – 100.
Информация о версиях: Параметр введён в версии ИРБИС 2012.1.

Параметры АРМ Администратор полнотекстовых БД

Секция TEXTS (irbisa_fulltext.ini)


isNeedRefreshBriefText
irbisa_fulltext.ini, секция TEXTS
Назначение: В зависимости от значения этого параметра изменяется логика обновления поля 22 (первые строки текста) при создании и актуализации словаря.
Использование: Возможные значения этого параметра: 0 – не обновлять, если в поле уже есть текст; 1 – обновлять поле безусловно. Отсутствие параметра эквивалентно присвоению значения 1. Исходное значение параметра в конфигурационном файле – 1.
Информация о версиях: Параметр введён в версии ИРБИС 2011.1.

isSboychakovThemeDictionaryEnable
irbisa_fulltext.ini, секция TEXTS
Назначение: Управляет построением тематического словаря.
Использование: Возможные значения этого параметра: 0 – не строить тематический словарь; 1 – строить тематический словарь. Отсутствие параметра эквивалентно присвоению значения 0. Исходное значение параметра в конфигурационном файле – 0.
Информация о версиях: Параметр введён в версии ИРБИС 2011.1.

Примечание: работа с тематическими словарями более не поддерживается, поэтому рекомендуется не включать данную функциональность.


method9_tryNotUseDirectDBAccess
irbisa_fulltext.ini, секция TEXTS
Назначение: Управляет интерпретацией ссылок на полные тексты.
Использование: Включение данного параметра значит, что требуется в 9 методе ТВП по возможности не использовать непосредственное чтение ссылки на текст из БД. Это возможно, если соответствующий элемент (результат работы формата в ТВП) является ссылкой на полный текст в формате БД, предварённой префиксом "FT-DB-LNK:". При этом параметр FULL_TEXT_Name не используется. Если нет возможности не использовать непосредственное чтение ссылки на текст из БД, то работает старый алгоритм (новая реализация старого алгоритма). Если значение параметра method9_tryNotUseDirectDBAccess=0, то работает старый алгоритм (старая реализация старого алгоритма). Отсутствие параметра эквивалентно присвоению значения 0. Исходное значение параметра в конфигурационном файле – 0.
Информация о версиях: Параметр введён в версии ИРБИС 2012.1.

Секция ABBY (irbisa_fulltext.ini)

Секция ABBY имеет отношение только к АРМ Администратор полнотекстовых БД, и используется при создании имидж-каталога.


EngineDllPath
irbisa_fulltext.ini, секция ABBY
Назначение: Полный путь к библиотеке FREngine.dll.

DeveloperSN
irbisa_fulltext.ini, секция ABBY
Назначение: Серийный номер, указанный на USB-ключе.

FR_LANGUAGES
irbisa_fulltext.ini, секция ABBY
Назначение: Cписок предполагаемых языков, используемый при распознавании.
Использование: Отсутствие параметра эквивалентно присвоению значения Russian,English,Ukrainian.
Информация о версиях: Параметр введён в версии ИРБИС 2011.1.

Параметры АРМ Читатель для полнотекстовых БД

Секция с именем базы данных

В секции с именем базы данных содержаться параметры, относящиеся только к данной базе.


SearchFrames
irbisr_fulltext.ini, секция имя_базы_данных
Назначение: Значение этого параметра – список имён форматов, перечисленных через запятую без пробелов, формирующих "заголовок" и "подвал" HTML-страницы с результатами поиска.
Использование: Отсутствие параметра эквивалентно присвоению значения search_header.pft,Result,search_Footer.pft. Один или несколько форматов до слова Result формируют "заголовок". Один или несколько форматов после слова Result формируют "подвал". Само слово Result служит разделителем. В исходном варианте параметр отсутствует в конфигурационном файле.

Секция MAIN (irbisr_fulltext.ini)

В секции MAIN присутствует ряд параметров, определяющих обработку файлов полных текстов. Описание данных параметров см. в подразделе Конфигурационные параметры, определяющие обработку файлов полных текстов


BriefPft
irbisr_fulltext.ini, секция MAIN
Назначение: Значение этого параметра – имя формата (без расширения), формирующего "середину" HTML-страницы с результатами поиска.
Использование: Исходное значение параметра в конфигурационном файле – BriefHTML.

IsNeedAddSomeTags
irbisr_fulltext.ini, секция SearchResultHTML
Назначение: Признак того, составит ли АРМ Читатель для полнотекстовых баз данных HTML-страницу с результатами поиска исключительно из результатов работы соответствующих форматов, или же будет добавлять некоторые теги.
Использование: Возможные значения: 1 – добавлять теги к результату работы формата, 0 – не добавлять теги. Отсутствие параметра эквивалентно присвоению значения 1. В исходном варианте параметр отсутствует в конфигурационном файле.
Информация о версиях: Параметр введён в версии ИРБИС 2010.1.

Секция SearchResultHTML (irbisr_fulltext.ini)


SearchEmpty
irbisr_fulltext.ini, секция SearchResultHTML
Назначение: Значение этого параметра – имя формата, формирующего HTML-страницу с пустым результатом поиска.
Использование: Отсутствие параметра эквивалентно присвоению значения search_empty.pft. В исходном варианте параметр отсутствует в конфигурационном файле.

SearchFooter
irbisr_fulltext.ini, секция SearchResultHTML
Назначение: Значение этого параметра – имя формата (или список имён форматов, перечисленных через запятую без пробелов), формирующего "подвал" HTML-страницы с результатами поиска.
Использование: При отсутствии данного параметра и параметра SearchHeader используется значение параметра SearchFrames из секции соответствующей базы данных. В исходном варианте параметр отсутствует в конфигурационном файле.

SearchHeader
irbisr_fulltext.ini, секция SearchResultHTML
Назначение: Значение этого параметра – имя формата (или список имён форматов, перечисленных через запятую без пробелов), формирующего "заголовок" HTML-страницы с результатами поиска.
Использование: При отсутствии данного параметра и параметра SearchFooter используется значение параметра SearchFrames из секции соответствующей базы данных. В исходном варианте параметр отсутствует в конфигурационном файле.

Ссылки

См. также:

Источники информации: