Список изменений ИРБИС версии 2013.1 — различия между версиями

Материал из Wikipedia
Перейти к: навигация, поиск
Строка 162: Строка 162:
 
* <tt>itext\itext.fst</tt>
 
* <tt>itext\itext.fst</tt>
  
===Версия 2013.1 от 2014-04-16 (D1+)===
+
===Версия 2013.1 от 2014-04-22 (D1+)===
  
 
====Доработки АРМ Администратор и АРМ Читатель для полнотекстовых БД====
 
====Доработки АРМ Администратор и АРМ Читатель для полнотекстовых БД====
Строка 168: Строка 168:
 
Исправлены ошибки:
 
Исправлены ошибки:
 
* В АРМ Администратор изменён алгоритм разбиения на страницы: запуск утилиты, извлекающей страницы, осуществляется до 3 раз при неудачном завершении. Тем самым удалось повысить стабильность работы АРМ Администратор, которая нарушалась за счёт зависания утилиты <tt>djvused.exe</tt>.
 
* В АРМ Администратор изменён алгоритм разбиения на страницы: запуск утилиты, извлекающей страницы, осуществляется до 3 раз при неудачном завершении. Тем самым удалось повысить стабильность работы АРМ Администратор, которая нарушалась за счёт зависания утилиты <tt>djvused.exe</tt>.
* В АРМ Администратор добавлена информация о версии программы в главном меню, пункт "О программе".
+
* В АРМ Администратор исправлена не критическая ошибка в алгоритме извлечения страниц. См. [[Отчёты об ошибках в системе ИРБИС#2014-04-14. Значительное замедление при добавлении файлов DJVU в случае большого количества страниц|отчёт о данной ошибке ''2014-04-14. Значительное замедление при добавлении файлов DJVU в случае большого количества страниц'']].
  
 
Доработки:
 
Доработки:
 
* В АРМ Администратор изменён алгоритм включения текстов в ПБД касательно файлов PDF и DJVU. Считается, что файл уже присутствует в ПБД, и не будет добавлен, если в ПБД присутствует ссылка на первую страницу соответствующего файла. Эта проверка осуществляется до разбиения файла на страницы. (До этого изменения алгоритм был следующим: 1) сначала осуществлялось разбиение на страницы; 2) затем происходила проверка наличия в ПБД каждой страницы.) Благодаря этому изменению снимается замечание [[Отчёты об ошибках в системе ИРБИС#2014-04-14. Неоправданно длительное ожидание при попытке повторного добавления файла PDF или DJVU|2014-04-14. Неоправданно длительное ожидание при попытке повторного добавления файла PDF или DJVU]].
 
* В АРМ Администратор изменён алгоритм включения текстов в ПБД касательно файлов PDF и DJVU. Считается, что файл уже присутствует в ПБД, и не будет добавлен, если в ПБД присутствует ссылка на первую страницу соответствующего файла. Эта проверка осуществляется до разбиения файла на страницы. (До этого изменения алгоритм был следующим: 1) сначала осуществлялось разбиение на страницы; 2) затем происходила проверка наличия в ПБД каждой страницы.) Благодаря этому изменению снимается замечание [[Отчёты об ошибках в системе ИРБИС#2014-04-14. Неоправданно длительное ожидание при попытке повторного добавления файла PDF или DJVU|2014-04-14. Неоправданно длительное ожидание при попытке повторного добавления файла PDF или DJVU]].
 +
* В АРМ Администратор добавлена возможность вызова окна с информацией о версии программы (главное меню, пункт ''О программе...'').
 +
* В АРМ Читатель добавлена возможность вызова окна с информацией о версии программы (главное меню, пункт ''О программе...'').
  
 
====Список обновлённых файлов в дистрибутиве====
 
====Список обновлённых файлов в дистрибутиве====

Версия 14:14, 22 апреля 2014

Содержание

Продукты ИРБИС для работы с полнотекстовыми базами данных

Правила выпуска и обозначения версий

О том, что собой представляют версии и обновления ИРБИС для ПБД см. в соответствующем подразделе ЧАВО по работе с ИРБИС

Первоначальный выпуск версии

Новая версия ИРБИС для ПБД выпускается в виде самостоятельного дистрибутива.

Обозначение версии ИРБИС для ПБД имеет следующий вид:

YYYY.N of yyyy.mm.dd

где

  • YYYY — год выпуска версии
  • N — номер версии в данном году (может быть 1, 2 и т.д.)
  • yyyy.mm.dd — дата выпуска версии.

Обозначение версии присутствует:

  • в окне, появляющемся на экране во время запуска АРМ Администратор для ПБД и АРМ Читатель для ПБД.

С конца апреля 2014 года обозначение версии также присутствует:

  • в имени файла дистрибутива;
  • в АРМ Администратор для ПБД и АРМ Читатель для ПБД (пункт главного меню О программе).

Выпуск обновления

После первоначального выпуска дистрибутива версии YYYY.N могут выходить обновления данной версии в виде:

  • самостоятельного дистрибутива и
  • пакета обновления.

Пакет обновления представляет собой упакованный в архив набор обновлённых файлов, предназначенных для копирования в развёрнутые у пользователей экземпляры системы ИРБИС для ПБД (замены устаревших версий файлов) соответствующей версии YYYY.N.

Обозначение обновлённых выпусков имеет следующий вид:

YYYY.N of yyyy.mm.dd (DX)

где

  • X в DX является номером обновления, например: D1, D2 и т.д.

Дополнительные обновления

Дополнительные обновления обозначаются знаком + после номера обновления:

YYYY.N of yyyy.mm.dd (DX+)

Установка и обновление ИРБИС для ПБД с использованием дистрибутивов и обновлений

Варианты установок и обновлений:

  • Новая установка.
  • Обновление предыдущей версии.
  • Обновление текущей версии.

См. Развёртывание программного обеспечения ИРБИС 64 для полнотекстовых баз данных и Инструкция по переходу на новую версию программного обеспечения ИРБИС 64.

Версия 2013.1 от 2013.11.01

Доработки АРМ Администратор и АРМ Читатель для полнотекстовых БД

  • В АРМ Читатель доработана функция полнотекстового поиска – реализована возможность поиска с учётом морфологии слов.

Механизм морфологии является альтернативой механизму правого усечения (который применяется в полнотекстовом поиске в версиях ниже 2013.1) и обеспечивает более точный поиск.

Пример: Выполняется полнотекстовый поиск по слову "СТОЛ". В случае применения правого усечения (как это происходило до сих пор) будут найдены документы, содержащие все флексии слова "СТОЛ" (стола, столу, столы, столами и т.д.), а также документы, содержащие слова "СТОЛБ", "СТОЛИЦА" (и все их формы) - что, конечно же, будет являться "шумом". В случае применения механизма морфологии - будут найдены ТОЛЬКО документы, содержащие слово "СТОЛ" и все его формы.

Включение/выключение данной возможности осуществляется в окне настроек при помощи опции Поиск с морфологическим разбором слов. Данная опция сохраняется в конфигурационном файле АРМ Читатель для полнотекстовых БД в параметре FullTextMorphology.

  • В АРМ Читатель реализована возможность выдачи результатов поиска с группировкой найденных страниц по исходному документу. Для включения/выключения данной возможности в конфигурационном файле АРМ Читатель для полнотекстовых БД введён параметр USE_TAGS_IN_SEARCH. Дополнительно введены параметры: Field_NUM_PAGES и Field_NUM_MFNS.
  • В АРМ Администратор доработан механизм создания словаря: появилась возможность распараллеливания, отбор может осуществляться параллельно несколькими процессами. Для указания количества процессов при создании словаря в конфигурационном файле АРМ Администратор ИРБИС введён параметр MULTILOAD.

Примечание: Данная доработка также реализована в последних обновлениях версий 2012.1 и 2011.1.

  • В АРМ Администратор изменён механизм включения текстов из электронного каталога. Отменена возможность включения файлов PDF и DJVU без разбиения на страницы. Многостраничные файлы PDF и DJVU включаются в полнотекстовую базу данных только с разбиением на страницы.
  • Реализована возможность прикреплять описания Dublin Core к многостраничным документам, добавленным к БД с разбиением на страницы. Описание Dublin Core прикрепляется к записи полнотекстовой БД, соответствующей первой странице документа. Другие страницы связываются с описанием Dublin Core посредством записи словаря (инвертированного файла); для установления связи используется подполе 952^b.
  • Реализовано добавление текстов PDF из электронного каталога с разбиением на страницы. Описание Dublin Core создаётся на основе библиографического описания, и прикрепляется к записи полнотекстовой БД, соответствующей первой странице документа.
  • В АРМ Читатель постраничный просмотр PDF файлов реализован на основе HTML-страницы, выступающей в роли шаблона. Для указания шаблона в конфигурационном файле АРМ Читатель для полнотекстовых БД добавлен параметр jpgViewerFilename. Комментарий: на основе данного шаблона реализована возможность изменения масштаба в окне постраничного просмотра PDF файлов (см. описание ниже).
  • В АРМ Читатель в окне постраничного просмотра PDF файлов добавлена возможность изменения масштаба просматриваемой страницы.

Доработки Веб-шлюза ИРБИС для полнотекстовых БД

  • Создан новый дизайн пользовательского интерфейса.
  • Изменился способ показа в результатах поиска найденных страниц из многостраничных документов. В результатах поиска показывается только первая найденная (самая релевантная) страница многостраничного документа вместе со ссылками на другие найденные страницы в порядке релевантности. То есть любой текст в результатах поиска отражается только один раз.
  • Формат показа многостраничного документа теперь включает текст начала документа.
  • Изменен формат постраничного листания многостраничного документа PDF.

Изменение порядка включения текстов в полнотекстовую БД

Новые возможности версии 2013.1
  • Концепция местоположения внешних ресурсов (текстов) позволяет использовать относительные ссылки на одни и те же тексты в разных БД (например, в БД ЭК и полнотекстовой). Достаточно в 11 строке соответствующих .par файлов указать одинаковое местоположение внешних ресурсов.
  • При использовании относительных ссылок местоположение текстов на файловой системе может быть легко изменено, при этом достаточно поменять путь в 11 строке .par файла(ов).
Ограничения, вводимые с версии 2013.1

Запрещено указание путей, начинающихся с буквы диска. Следует указывать пути UNC (например: \\ComputerName\SharedFolder\Resource.pdf).

По умолчанию, при включении текстов по абсолютным путям, разрешено указывать только ЛОКАЛЬНЫЕ пути UNC (запрещено включать тексты с других компьютеров в локальной сети). Для включения/выключения данного ограничения в конфигурационном файле АРМ Администратор ИРБИС введён параметр onlyLocalUncPath.

Рекомендации по включению текстов в полнотекстовую БД

Размещать внешние ресурсы (тексты) следует локально (на том же компьютере, где установлен ИРБИС для полнотекстовых БД).

При включении текстов в полнотекстовую БД предпочтительно использование относительных путей.

Рекомендуется выбрать одно местоположение внешних ресурсов (текстов), указать его В 11 строке .par файла, и при включении текстов в полнотекстовую базу использовать относительные пути.

В 11 строке .par файла в качестве пути рекомендуется использовать:

  • относительный путь, начинающийся с точки или
  • UNC-путь к файлу (например: \\ComputerName\SharedFolder\Resource.pdf)

Только при невозможности размещения внешних ресурсов (текстов) внутри одной папки при включении текстов в полнотекстовую БД следует использовать абсолютные пути.

Другие изменения АРМ Администратор и АРМ Читатель для полнотекстовых БД

  • По умолчанию включено построение тематического словаря. В конфигурационном файле irbisa_fulltext.ini в исходной конфигурации убран параметр isSboychakovThemeDictionaryEnable; изменено умолчание для случая отсутствия данного параметра в конфигурационном файле.

Список обновлённых файлов в дистрибутиве

  • Irbis64_FullTextAdministrator.exe
  • Irbis64_FullTextReader.exe
  • irbis64.dll с форматным выходом +9S
  • ТВП для инвертированного файла полнотекстовой БД
  • extra_unifor.dll
  • sr.js, search_header.pft, BriefHTML_web_brief.pft, BriefHTML_mfn.pft, search_empty.pft, BriefHTML_web_nearmfn.pft, bottom_string.pft
  • jpgViewer.html

Список изменений в конфигурационных файлах

irbisa_fulltext.ini
[main]
# isSboychakovThemeDictionaryEnable - убран из исходной конфигурации
MULTILOAD=1
irbisr_fulltext.ini
[main]
# Включение/выключение возможности поиска с учётом морфологии слов (сохраняет значение опции Поиск с морфологическим разбором слов).
FullTextMorphology=1
# Включение/выключение возможности выдачи результатов поиска с группировкой найденных страниц по исходному документу.
USE_TAGS_IN_SEARCH=1
# Имя шаблона HTML-страницы, используемой для показа страницы PDF-документа.
jpgViewerFilename=.\jpgViewer.html

[VirtualFields]
Field_NUM_PAGES=3500
Field_NUM_MFNS=3501

[DESKTOP]
Panel_DictionGrid_Visible=0

Версия 2013.1 от 2014-03-12 (D1)

Список обновлённых файлов в данной версии ИРБИС ПБД:

  • Irbis64_FullTextAdministrator.exe (АРМ Администратор полнотекстовых БД 2013.1 от 2014-03-12)
  • irbis64.dll (дата изменения от 12.03.2014)

Список обновлённых файлов в БД:

  • itext\itext.fst

Версия 2013.1 от 2014-04-22 (D1+)

Доработки АРМ Администратор и АРМ Читатель для полнотекстовых БД

Исправлены ошибки:

Доработки:

  • В АРМ Администратор изменён алгоритм включения текстов в ПБД касательно файлов PDF и DJVU. Считается, что файл уже присутствует в ПБД, и не будет добавлен, если в ПБД присутствует ссылка на первую страницу соответствующего файла. Эта проверка осуществляется до разбиения файла на страницы. (До этого изменения алгоритм был следующим: 1) сначала осуществлялось разбиение на страницы; 2) затем происходила проверка наличия в ПБД каждой страницы.) Благодаря этому изменению снимается замечание 2014-04-14. Неоправданно длительное ожидание при попытке повторного добавления файла PDF или DJVU.
  • В АРМ Администратор добавлена возможность вызова окна с информацией о версии программы (главное меню, пункт О программе...).
  • В АРМ Читатель добавлена возможность вызова окна с информацией о версии программы (главное меню, пункт О программе...).

Список обновлённых файлов в дистрибутиве

  • Irbis64_FullTextAdministrator.exe
  • Irbis64_FullTextReader.exe
  • Irbismsg.txt

irbis64.dll

Дата изменения от 19.09.2013

Добавлены форматные выходы UNIFOR:

  • +9L
  • +9S

Дата изменения от 12.03.2014

Добавлены форматные выходы UNIFOR:

  • +3C

Редактор ISO/MST файлов

Дата изменения от 11.04.2014

Доработки:

  • При открытии файлов в формате ISO 2709 реализована возможность пропуска ошибок в формате файла и поиск целостных записей (как это реализовано для файлов MST).
  • Вывод сведений о возникающих в процессе открытия редактором файлов в формате ISO 2709 ошибок в формате открываемого файла дополнен (в частности, позицией начала записи). Данная доработка облегчает анализ нарушений в формате файла.
  • Реализован вывод в лог сообщений в процессе открытия редактором файлов в формате ISO 2709.

Исправление ошибок:

  • Устранена ошибка, в результате которой было невозможно открытие редактором файлов, размер которых превышает 2 Гб.

Ссылки

См. также: