Список изменений ИРБИС версии 2012.1 — различия между версиями

Материал из Wikipedia
Перейти к: навигация, поиск
Строка 3: Строка 3:
 
===Доработки===
 
===Доработки===
  
* Добавлена возможность индексирования файлов PDF, защищённых паролем. Подробнее о данной возможности см. [[Полнотекстовые базы данных ИРБИС#Индексирование файлов PDF, защищённых паролем|в подразделе ''Индексирование файлов PDF, защищённых паролем'' статьи ''Полнотекстовые базы данных ИРБИС'']]. Для указания необходимости снятия защиты и указания пароля введены параметры <tt>isNeedDecryptPDF</tt> и <tt>PDFPassword</tt> в [[Конфигурационный файл АРМ Администратор ИРБИС#Секция TEXTS|конфигурационном файле АРМ Администратор ИРБИС]].
+
* Добавлена возможность включения и индексирования файлов PDF, защищённых паролем. Подробнее о данной возможности см. [[Полнотекстовые базы данных ИРБИС#Индексирование файлов PDF, защищённых паролем|в подразделе ''Индексирование файлов PDF, защищённых паролем'' статьи ''Полнотекстовые базы данных ИРБИС'']]. Для указания необходимости снятия защиты и указания пароля введены параметры <tt>isNeedDecryptPDF</tt> и <tt>PDFPassword</tt> в [[Конфигурационный файл АРМ Администратор ИРБИС#Секция TEXTS|конфигурационном файле АРМ Администратор ИРБИС]].
* В [[Конфигурационный файл АРМ Администратор ИРБИС#Секция TEXTS|конфигурационный файл АРМ Администратор ИРБИС]] добавлен параметр <tt>MAX_TIME_CONVERTING</tt>, позволяющий задавать максимальное время работы утилит, выполняющих извлечение текста и извлечение страниц из полнотекстовых документов.
+
* Добавлена возможность регулировать максимальное время работы утилит, выполняющих извлечение текста и извлечение страниц из полнотекстовых документов. Это бывает необходимо в [[Развёртывание программного обеспечения ИРБИС 64 для полнотекстовых баз данных#Требования и рекомендации по отношению к текстовым документам, включаемым в полнотекстовую базу|некоторых случаях, когда не хватает отведённого времени]]. Для этого в [[Конфигурационный файл АРМ Администратор ИРБИС#Секция TEXTS|конфигурационный файл АРМ Администратор ИРБИС]] добавлен параметр <tt>MAX_TIME_CONVERTING</tt>.
 
* В [[Конфигурационный файл АРМ Администратор ИРБИС#Секция TEXTS|конфигурационный файл АРМ Администратор ИРБИС]] добавлен параметр <tt>isNeedSplitInsteadExtract</tt>. Этот параметр касается некоторых особенностей использования утилит по разбиению PDF-файлов на страницы.
 
* В [[Конфигурационный файл АРМ Администратор ИРБИС#Секция TEXTS|конфигурационный файл АРМ Администратор ИРБИС]] добавлен параметр <tt>isNeedSplitInsteadExtract</tt>. Этот параметр касается некоторых особенностей использования утилит по разбиению PDF-файлов на страницы.
 
* В АРМ Читатель реализована возможность поиска с использованием "морфологии" слов в качестве альтернативы усечению. Выбор осуществляется в окне настроек, сохраняется в ini-файле (параметр <tt>MorphologicMode</tt>).
 
* В АРМ Читатель реализована возможность поиска с использованием "морфологии" слов в качестве альтернативы усечению. Выбор осуществляется в окне настроек, сохраняется в ini-файле (параметр <tt>MorphologicMode</tt>).
 
* Кеширование извлечённых страниц PDF. Доработка обеспечивает оптимизацию скорости выдачи пользователям страниц полнотекстовых документов.
 
* Кеширование извлечённых страниц PDF. Доработка обеспечивает оптимизацию скорости выдачи пользователям страниц полнотекстовых документов.
* Добавлено выделение найденных слов на страницах PDF документов (при включении текстов с разбиением на страницы). При этом выдача изображений страниц для читателя осуществляется в формате графических изображений (.jpg).
+
* Обеспечено выделение поисковых терминов на найденных страницах PDF документов (при включении текстов с разбиением на страницы). При этом выдача страниц для читателя осуществляется в формате графических изображений (.jpg).
  
 
===Дополнительная информация, касающаяся доработок===
 
===Дополнительная информация, касающаяся доработок===
Строка 16: Строка 16:
 
=====Кеширование отдельных страниц многостраничного документа=====
 
=====Кеширование отдельных страниц многостраничного документа=====
  
В параметрах конфигурационномго файла АРМ Администратор TextPath и TextPathAlias задаётся список путей к папкам-"местам хранения полных текстов" и список условных названий этих "мест хранения". В обоих списках значения хранятся в двойных кавычках, перечислены через запятую.
+
В параметрах конфигурационномго файла АРМ Администратор TextPath и TextPathAlias задаётся список путей к папкам с полными текстами и список условных названий этих папок. В обоих списках значения хранятся в двойных кавычках, перечислены через запятую.
  
Например, мы хотим указать место хранения с абсолютными путями и место хранения текстов внутри базы данных (которые будут добавлены с относительными путями), для этого в конфигурационном файле АРМ Администратор в секции TEXTS добавим параметры
+
Например, есть тексты находящиеся в папке "\\server\FullTexts\" и есть тексты внутри базы данных TESTDB (которые добавляются с относительными путями). Допустим, мы хотим, чтобы кеш страниц для этих текстов формировался соответственно в двух разных папках (это удобно) внутри корневой папки кеша: например, в "FullTexts 1" для текстов, находящихся в "\\server\FullTexts\" и в "FullTexts 2" для текстов, находящихся в папке базы данных. Для этого в конфигурационном файле АРМ Администратор в секции TEXTS необходимо добавить параметры:
 
  TextPath="\\server\FullTexts\","c:\irbisFT2012.1\IRBIS64\DATAI\TESTDB\"
 
  TextPath="\\server\FullTexts\","c:\irbisFT2012.1\IRBIS64\DATAI\TESTDB\"
 
  TextPathAlias="FullTexts 1","FullTexts 2"
 
  TextPathAlias="FullTexts 1","FullTexts 2"
Строка 24: Строка 24:
 
  TextCacheRootPath=d:\irbis-cache
 
  TextCacheRootPath=d:\irbis-cache
  
При сохранении страниц в кеше для текстов из "\\server\FullTexts\" в корневой папке кеша будет создана папка "FullTexts 1". А для текстов из базы TESTDB соответственно "FullTexts 2".
+
В результате этих настроек страницы кеша для текстов из "\\server\FullTexts\" (непосредственно в указанной папке или в подпапках) будут сохраняться в папке "FullTexts 1" внутри корневой папки кеша. Для текстов из базы TESTDB для этого будет использована папка "FullTexts 2" внутри корневой папки кеша.
 +
 
 +
Для тех текстов, для которых не найдено подходящих значений в TextPath, файлы кеша будут находиться внутри корневой папки кеша, но не будут сгруппированы.
 +
 
 +
Если не задана папка для хранения кеша, файлы-результаты разбиения на страницы будут сохранены в рабочей директории и удалены позавершении работы программы.
  
 
==Ссылки==
 
==Ссылки==

Версия 17:04, 20 сентября 2012

Продукты ИРБИС для работы с полнотекстовыми базами данных

Доработки

Дополнительная информация, касающаяся доработок

АРМ Администратор полнотекстовых БД

Кеширование отдельных страниц многостраничного документа

В параметрах конфигурационномго файла АРМ Администратор TextPath и TextPathAlias задаётся список путей к папкам с полными текстами и список условных названий этих папок. В обоих списках значения хранятся в двойных кавычках, перечислены через запятую.

Например, есть тексты находящиеся в папке "\\server\FullTexts\" и есть тексты внутри базы данных TESTDB (которые добавляются с относительными путями). Допустим, мы хотим, чтобы кеш страниц для этих текстов формировался соответственно в двух разных папках (это удобно) внутри корневой папки кеша: например, в "FullTexts 1" для текстов, находящихся в "\\server\FullTexts\" и в "FullTexts 2" для текстов, находящихся в папке базы данных. Для этого в конфигурационном файле АРМ Администратор в секции TEXTS необходимо добавить параметры:

TextPath="\\server\FullTexts\","c:\irbisFT2012.1\IRBIS64\DATAI\TESTDB\"
TextPathAlias="FullTexts 1","FullTexts 2"

Чтобы задать корневую папку кеша добавим параметр

TextCacheRootPath=d:\irbis-cache

В результате этих настроек страницы кеша для текстов из "\\server\FullTexts\" (непосредственно в указанной папке или в подпапках) будут сохраняться в папке "FullTexts 1" внутри корневой папки кеша. Для текстов из базы TESTDB для этого будет использована папка "FullTexts 2" внутри корневой папки кеша.

Для тех текстов, для которых не найдено подходящих значений в TextPath, файлы кеша будут находиться внутри корневой папки кеша, но не будут сгруппированы.

Если не задана папка для хранения кеша, файлы-результаты разбиения на страницы будут сохранены в рабочей директории и удалены позавершении работы программы.

Ссылки

См. также: