Список изменений ИРБИС версии 2012.1 — различия между версиями

Материал из Wikipedia
Перейти к: навигация, поиск
 
Строка 8: Строка 8:
 
* Добавлена возможность регулировать максимальное время работы утилит, выполняющих извлечение текста и извлечение страниц из полнотекстовых документов. Это бывает необходимо в [[Установка и использование ИРБИС 64 для полнотекстовых баз данных#Требования и рекомендации по отношению к текстовым документам, включаемым в полнотекстовую базу|некоторых случаях, когда не хватает отведённого времени]]. Для этого в [[Конфигурационные параметры ИРБИС для полнотекстовых БД|конфигурационный файл АРМ Администратор ИРБИС]] добавлен параметр <tt>MAX_TIME_CONVERTING</tt>.
 
* Добавлена возможность регулировать максимальное время работы утилит, выполняющих извлечение текста и извлечение страниц из полнотекстовых документов. Это бывает необходимо в [[Установка и использование ИРБИС 64 для полнотекстовых баз данных#Требования и рекомендации по отношению к текстовым документам, включаемым в полнотекстовую базу|некоторых случаях, когда не хватает отведённого времени]]. Для этого в [[Конфигурационные параметры ИРБИС для полнотекстовых БД|конфигурационный файл АРМ Администратор ИРБИС]] добавлен параметр <tt>MAX_TIME_CONVERTING</tt>.
 
* Добавлена возможность извлечения всех страниц при обращении к любой из них. В предыдущих версиях происходило извлечение каждой отдельной страницы при обращении к ней. Для управления этой возможностью в [[Конфигурационные параметры ИРБИС для полнотекстовых БД|конфигурационный файл АРМ Администратор ИРБИС]] добавлен параметр <tt>isNeedSplitInsteadExtract</tt>. Данная возможность добавлена в АРМ Администратор ИРБИС и в АРМ Читатель ИРБИС.
 
* Добавлена возможность извлечения всех страниц при обращении к любой из них. В предыдущих версиях происходило извлечение каждой отдельной страницы при обращении к ней. Для управления этой возможностью в [[Конфигурационные параметры ИРБИС для полнотекстовых БД|конфигурационный файл АРМ Администратор ИРБИС]] добавлен параметр <tt>isNeedSplitInsteadExtract</tt>. Данная возможность добавлена в АРМ Администратор ИРБИС и в АРМ Читатель ИРБИС.
* Кеширование извлечённых страниц PDF. Доработка обеспечивает оптимизацию скорости выдачи пользователям страниц полнотекстовых документов.
+
* Кеширование извлечённых страниц PDF. Доработка обеспечивает оптимизацию скорости выдачи пользователям страниц полнотекстовых документов. (Подробнее см. в статье [[Кеширование на файловой системе страниц многостраничного документа]].)
 
* Обеспечено выделение поисковых терминов на найденных страницах PDF документов (при включении текстов с разбиением на страницы). При этом выдача страниц для читателя осуществляется в формате графических изображений (.jpg).
 
* Обеспечено выделение поисковых терминов на найденных страницах PDF документов (при включении текстов с разбиением на страницы). При этом выдача страниц для читателя осуществляется в формате графических изображений (.jpg).
 
* Добавлена [[Относительная адресация в ИРБИС#Относительные ссылки на внешние объекты в базах данных электронного каталога и в полнотекстовых базах|возможность использования относительных путей для текстов, хранящихся вне папки базы данных]]. Для этого добавлена [[Базы данных ИРБИС#par-файл|11-я строка <tt>.par</tt>-файла]].
 
* Добавлена [[Относительная адресация в ИРБИС#Относительные ссылки на внешние объекты в базах данных электронного каталога и в полнотекстовых базах|возможность использования относительных путей для текстов, хранящихся вне папки базы данных]]. Для этого добавлена [[Базы данных ИРБИС#par-файл|11-я строка <tt>.par</tt>-файла]].
Строка 23: Строка 23:
  
 
====АРМ Администратор полнотекстовых БД====
 
====АРМ Администратор полнотекстовых БД====
 
=====Кеширование отдельных страниц многостраничного документа=====
 
 
В параметрах конфигурационномго файла АРМ Администратор TextPath и TextPathAlias задаётся список путей к папкам с полными текстами и список условных названий этих папок. В обоих списках значения хранятся в двойных кавычках, перечислены через запятую.
 
 
Например, есть тексты находящиеся в папке "\\server\FullTexts\" и есть тексты внутри базы данных TESTDB (которые добавляются с относительными путями). Допустим, мы хотим, чтобы кеш страниц для этих текстов формировался соответственно в двух разных папках (это удобно) внутри корневой папки кеша: например, в "FullTexts 1" для текстов, находящихся в "\\server\FullTexts\" и в "FullTexts 2" для текстов, находящихся в папке базы данных. Для этого в конфигурационном файле АРМ Администратор в секции TEXTS необходимо добавить параметры:
 
TextPath="\\server\FullTexts\","c:\irbisFT2012.1\IRBIS64\DATAI\TESTDB\"
 
TextPathAlias="FullTexts 1","FullTexts 2"
 
Чтобы задать корневую папку кеша добавим параметр
 
TextCacheRootPath=d:\irbis-cache
 
 
В результате этих настроек страницы кеша для текстов из "\\server\FullTexts\" (непосредственно в указанной папке или в подпапках) будут сохраняться в папке "FullTexts 1" внутри корневой папки кеша. Для текстов из базы TESTDB для этого будет использована папка "FullTexts 2" внутри корневой папки кеша.
 
 
Для тех текстов, для которых не найдено подходящих значений в TextPath, файлы кеша будут находиться внутри корневой папки кеша, но не будут сгруппированы.
 
 
Если не задана папка для хранения кеша, файлы-результаты разбиения на страницы будут сохранены в рабочей директории и удалены по завершении работы программы.
 
 
''Примечание: если не задана папка для хранения кеша, то кеш будет создаваться в папке workdir в подпапке TEXTCACHEROOT и будет удалён при завершении работы АРМ Администратор. Параметры TextPath и TextPathAlias в этом случае тоже используются и играют такую же роль, как и в случае указания места для хранения кеша.''
 
  
 
===Обновление АРМ Читатель полнотекстовых БД 2012.1 от 2013-01-30===
 
===Обновление АРМ Читатель полнотекстовых БД 2012.1 от 2013-01-30===
Строка 49: Строка 31:
 
===Обновление АРМ Администратор полнотекстовых БД 2012.1 от 2013-02-06 и АРМ Читатель полнотекстовых БД 2012.1 от 2013-02-06===
 
===Обновление АРМ Администратор полнотекстовых БД 2012.1 от 2013-02-06 и АРМ Читатель полнотекстовых БД 2012.1 от 2013-02-06===
  
* Обновление механизма кеширования отдельных страниц многостраничного документа. Устранена зависимость имени папки кеша от регистра элементов пути и регистра имени исходного файла.
+
* Обновление механизма [[Кеширование на файловой системе страниц многостраничного документа|кеширования отдельных страниц многостраничного документа]]. Устранена зависимость имени папки кеша от регистра элементов пути и регистра имени исходного файла.
  
 
===Обновление утилиты pdftotext.exe до версии 3.03===
 
===Обновление утилиты pdftotext.exe до версии 3.03===

Текущая версия на 19:20, 15 июля 2015

Полное описание релиза ИРБИС 2012.1 см. в файле описания релиза 2012.1.

Продукты ИРБИС для работы с полнотекстовыми базами данных

Доработки

Доработки, включённые в обновления версии

  • 9 метод индексирования реализован с использованием исключительно ТВП для инвертированного файла (без непосредственного доступа к базе данных). Подробнее о данной доработке см. в статье Список изменений ИРБИС версии 2013.1.
  • Исправлены ошибки в механизме относительной адресации при помощи 11-й строки .par-файла в АРМ Администратор и АРМ Читатель для полнотекстовых БД.

Отозванные доработки

  • В АРМ Читатель анонсирована, но НЕ РАБОТАЕТ возможность поиска с использованием "морфологии" слов в качестве альтернативы усечению. Выбор осуществляется в окне настроек, сохраняется в ini-файле (параметр FullTextMorphology).

Дополнительная информация, касающаяся доработок

АРМ Администратор полнотекстовых БД

Обновление АРМ Читатель полнотекстовых БД 2012.1 от 2013-01-30

  • Убрана инициализация базы данных MORPH при запуске АРМ (а также при открытии найденных документов). В выпуске версии 2012.1 при запуске АРМ Читатель полнотекстовых БД (а также при открытии найденных документов) происходит ошибка "Morph error 0" в случае отсутствия базы данных MORPH. Данное обновление устраняет эту ошибку.
  • Обновлён номер версии до 2012.1. В выпуске версии 2012.1 в заставке АРМ Читатель полнотекстовых БД фигурирует номер версии 2011.1.

Обновление АРМ Администратор полнотекстовых БД 2012.1 от 2013-02-06 и АРМ Читатель полнотекстовых БД 2012.1 от 2013-02-06

Обновление утилиты pdftotext.exe до версии 3.03

Рекомендуется обновить утилиту pdftotext.exe до версии 3.03.

См. сообщение об обновлении на форуме.

Обновление D1

Включает в себя АРМ Администратор полнотекстовых БД 2012.1 от 2013-02-06 и АРМ Читатель полнотекстовых БД 2012.1 от 2013-02-06.

См. сообщение о выпуске обновления на форуме.

Обновление АРМ Администратор полнотекстовых БД 2012.1 от 2013-07-02 и АРМ Читатель полнотекстовых БД 2012.1 от 2013-07-04

  • Обеспечена работоспособность механизма указания пути к файлам в 11-й строке .par-файла в АРМ Администратор и АРМ Читатель для полнотекстовых БД.

Обновление D2

Включает в себя АРМ Администратор полнотекстовых БД 2012.1 от 2013-07-02 и АРМ Читатель полнотекстовых БД 2012.1 от 2013-07-04.

См. сообщение о выпуске обновления на форуме.

Также рекомендуется обновить утилиту pdftotext.exe до версии 3.03.

Ссылки

См. также: