Список изменений ИРБИС версии 2014.1 — различия между версиями

Материал из Wikipedia
Перейти к: навигация, поиск
 
(не показано 13 промежуточных версий этого же участника)
Строка 1: Строка 1:
 
==Продукты ИРБИС для работы с полнотекстовыми базами данных==
 
==Продукты ИРБИС для работы с полнотекстовыми базами данных==
  
===Версия 2014.1 (в разработке)===
+
===Версия 2014.1 от 2014-12-28===
  
====Доработки====
+
====Доработки АРМ Администратор и АРМ Читатель для полнотекстовых БД====
  
* Оптимизирован процесс создания словаря: при создании словаря текстовый слой сохраняется в БД, если не был сохранён ранее; если текстовый слой ранее был сохранён в БД, то он не извлекается. Это позволяет избежать повторного извлечения текста из тех текстовых документов, из которых он был извлечён ранее. Например, это ускоряет процесс создания словаря в том случае, если в БД были добавлены тексты, и осуществляется Создание словаря заново.
+
'''Доработка ''Формы добавления текстов'':'''
  
Для хранения текстового слоя в БД [[была изменена схема полнотекстовой БД: было добавлено поле 27]].
+
* Обеспечена "отзывчивость" формы для полнотекстовых баз данных со значительным количеством текстов (тысячи). На форме в списке добавленных по умолчанию отображается только часть текстов: в количестве, не превышающем значение, указанное в параметре <tt>FT_LIST_PORTION_SIZE</tt> секции <tt>MAIN</tt> (отсутствие параметра эквивалентно указанию 1000). При необходимости показа большего количества текстов можно воспользоваться кнопкой ''Показать больше текстов''.
  
Также, если текстовый слой ранее был сохранён в БД, то не обновляются: индекс естественно-тематического классификатора (поле 21), первые строки текста (поле 22), количество слов в тексте (поле 20). Соответственно, утратил актуальность параметр <tt>isNeedRefreshBriefText</tt>.
+
* Повышена выразительность: теперь в таблице одному PDF файлу соответствует одна запись (не показывается ссылка на каждую страницу PDF-файла).
  
* Изменения, касающиеся таблицы добавленных текстов в форме добавления текстов:
+
'''Доработки, касающиеся оптимизации процессов включения текстов в ПБД и создания словаря:'''
** Устранено "зависание" формы (необходимость длительного ожидания), проявлявшееся с увеличением количества добавленных текстов (тысячи). В результате, для устранения "зависания" решено, что могут быть показаны не все добавленные тексты: форма показывает количество текстов, не превышающее количество, указанное в параметре <tt>FT_LIST_PORTION_SIZE</tt> секции <tt>MAIN</tt> (отсутствие параметра эквивалентно указанию 1000). При необходимости добавлена кнопка ''Показать больше текстов''.
 
** Повышена выразительность: теперь в таблице одному PDF файлу соответствует одна запись (не показывается ссылка на каждую страницу PDF-файла).
 
  
* [[Включение в полнотекстовую базу текстов из базы данных электронного каталога|Повышена гибкость алгоритма импорта текстов из электронного каталога.]] Обычно для поиска ссылок на тексты используется подполе <tt>v951^A</tt>. Ранее данное правило было жёстко закреплено. [[Теперь для получения ссылок используется формат, который можно указать в параметре]] <tt>EC_IMPORT_PATH_FORMAT</tt> секции <tt>TEXTS</tt>.
+
* Оптимизирован процесс создания словаря: при создании словаря текстовый слой сохраняется в БД, если не был сохранён ранее; если текстовый слой ранее был сохранён в БД, то он не извлекается. Это позволяет избежать повторного извлечения текста из тех текстовых документов, из которых он был извлечён ранее. Например, это ускоряет процесс создания словаря при повторном ''Создании словаря заново'' (после добавления текстов в БД).<br/>Для хранения текстового слоя в БД [[#Изменения схемы полнотекстовой БД|добавлено поле 27]].<br/>Также, если текстовый слой ранее был сохранён в БД, то не обновляются: индекс естественно-тематического классификатора (поле 21), первые строки текста (поле 22), количество слов в тексте (поле 20). Соответственно, утратил актуальность параметр <tt>isNeedRefreshBriefText</tt>.
  
* Проверка присутствия текста в БД для многостраничного документа:
+
* Алгоритм [[Включение текстов в полнотекстовую базу данных#Включение в полнотекстовую базу текстов из базы данных электронного каталога|импорта текстов из электронного каталога]] изменён таким образом, что ссылки могут быть сгенерированы в соответствии с указанным форматом. См. [[Включение текстов в полнотекстовую базу данных#Алгоритм получения ссылок из базы данных электронного каталога|подраздел ''Алгоритм получения ссылок из базы данных электронного каталога'' статьи ''Включение текстов в полнотекстовую базу данных'']].
 +
 
 +
* При включении текста в полнотекстовую базу [[Включение текстов в полнотекстовую базу данных#Исключение повторного добавления текстов|оптимизирована проверка присутствия текста в БД для многостраничного документа]]:
 
** Определяется номер последней страницы в документе (равный количеству страниц). Если количество страниц не удалось определить (для DJVU не определяется), то номер последней страницы считается равным 1.
 
** Определяется номер последней страницы в документе (равный количеству страниц). Если количество страниц не удалось определить (для DJVU не определяется), то номер последней страницы считается равным 1.
 
** Если последняя страница присутствует в базе, то считается, что данный многостраничный документ присутствует, и он пропускается.
 
** Если последняя страница присутствует в базе, то считается, что данный многостраничный документ присутствует, и он пропускается.
Строка 23: Строка 23:
  
 
* Для файлов PDF при добавлении документа не производится разбиение на страницы. Впрочем, нельзя однозначно считать это оптимизацией. Поскольку извлечённые страницы сохраняются в кеше (до закрытия АРМ Администратор, или на постоянной основе, если настроен кеш). При построении словаря всё равно возникает необходимость извлекать страницы. Разница в том, процесс отбора может быть многопроцессным. С другой стороны, в зависимости от настроек, при отборе может происходить разбиение на страницы (что быстрее, но теряет силу аргумент ускорения за счёт многопроцессного отбора), или извлекаться отдельные страницы (что значительно медленнее).
 
* Для файлов PDF при добавлении документа не производится разбиение на страницы. Впрочем, нельзя однозначно считать это оптимизацией. Поскольку извлечённые страницы сохраняются в кеше (до закрытия АРМ Администратор, или на постоянной основе, если настроен кеш). При построении словаря всё равно возникает необходимость извлекать страницы. Разница в том, процесс отбора может быть многопроцессным. С другой стороны, в зависимости от настроек, при отборе может происходить разбиение на страницы (что быстрее, но теряет силу аргумент ускорения за счёт многопроцессного отбора), или извлекаться отдельные страницы (что значительно медленнее).
 +
 +
'''Прочие доработки:'''
  
 
* Текст NO_TEXT_AT_PAGE для нераспознанных страниц и соответствующий параметр.
 
* Текст NO_TEXT_AT_PAGE для нераспознанных страниц и соответствующий параметр.
 +
 +
====Изменения схемы полнотекстовой БД====
 +
 +
* [[Добавлено поле 27.]]
 +
 +
====Совместимость с предыдущими версиями====
 +
 +
АРМ Администратор, АРМ Читатель для полнотекстовых БД и Веб-шлюз ИРБИС для полнотекстовых БД не совместимы с библиотекой <tt>irbis64.dll</tt> предыдущих версий.
 +
 +
Библиотека <tt>irbis64.dll</tt> не совместима с АРМ Администратор, АРМ Читатель для полнотекстовых БД и Веб-шлюз ИРБИС для полнотекстовых БД предыдущих версий.
 +
 +
====Список обновлённых файлов в дистрибутиве====
 +
 +
* <tt>Irbis64_FullTextAdministrator.exe</tt>
 +
* <tt>Irbis64_FullTextReader.exe</tt>
 +
* <tt>irbis64.dll</tt>
 +
 +
У данных запускаемых файлов и dll отсутствует совместимость с запускаемыми файлами и dll предыдущих версий.
 +
 +
====Список изменений в конфигурационных файлах====
 +
 +
=====<tt>irbisa_fulltext.ini</tt>=====
 +
 +
[main]
 +
# FT_LIST_PORTION_SIZE - отсутствует в исходной конфигурации
 +
 +
[texts]
 +
# EC_IMPORT_PATH_FORMAT - отсутствует в исходной конфигурации
 +
# NO_TEXT_AT_PAGE - отсутствует в исходной конфигурации
 +
# alwaysRefreshTextRecord - отсутствует в исходной конфигурации
 +
# isNeedRefreshBriefText - утратил актуальность, убран из исходной конфигурации
 +
# method9_tryNotUseDirectDBAccess - утратил актуальность, убран из исходной конфигурации
 +
 +
===Версия 2014.1 of 2015-01-21 (D1)===
 +
 +
В АРМ Администратор исправлена ошибка создания словаря с символами юникода (внесённая с выпуском версии 2014.1 и обычно проявляющаяся для текстов на языках кроме русского и английского). Для исправления необходимо: обновить версию системы ИРБИС ПБД, для уже созданных баз – создать словарь заново.
 +
 +
В АРМ Читатель для полнотекстовых БД приведён в соответствие отображаемый номер версии.
 +
 +
====Список обновлённых файлов в дистрибутиве====
 +
 +
* <tt>Irbis64_FullTextAdministrator.exe</tt>
 +
* <tt>Irbis64_FullTextReader.exe</tt>
 +
 +
===Версия 2014.1 of 2015-01-30 (D1+)===
 +
 +
Исправлена ошибка в Веб-шлюзе ИРБИС (внесённая с выпуском версии 2014.1; проблемы с постраничным отображением текстов PDF при использовании абсолютных путей).
 +
 +
Для демонстрационной базы словарь создан заново, чтобы обеспечить показ новых возможностей версии 2014.1.
 +
 +
В АРМ Администратор исправлена ошибка - восстановлена возможность удаления текстов из полнотекстовой базы данных.
 +
 +
====Список обновлённых файлов в дистрибутиве====
 +
 +
* <tt>Irbis64_FullTextAdministrator.exe</tt>
 +
* Демонстрационная полнотекстовая база (файлы базы данных).
 +
* Файлы Веб-ИРБИС
 +
 +
===Изменения в составе дистрибутива от 2015-02-19===
 +
 +
Исправлена ошибка, связанная с невозможностью установить веб-шлюз ИРБИС в случае поставки, в которую не входит АРМ Читатель для полнотекстовых БД (см. [http://irbis.gpntb.ru/read.php?48,93002 описание ошибки на форуме]).
 +
 +
Теперь в поставку в любом случае входит конфигурационный файл для АРМ Читатель для полнотекстовых БД.
 +
 +
===Версия 2014.1 of 2015-02-27 (D1+)===
 +
 +
Исправлена ошибка распараллеливания отбора при создании словаря. В дистрибутив включён недостающий файл.
 +
 +
====Список обновлённых файлов в дистрибутиве====
 +
 +
Добавлен:
 +
* <tt>IrbisMultiLoad.exe</tt>
 +
 +
===Версия 2014.1 of 2015-03-19 (D1+)===
 +
 +
В АРМ Администратор исправлена ошибка, проявляющаяся как отсутствие возможности использовать справочники, размещённые в папке DEPOSIT (см. [http://irbis.gpntb.ru/read.php?48,95192 обращение на форуме]).
 +
 +
====Список обновлённых файлов в дистрибутиве====
 +
 +
* <tt>Irbis64_FullTextAdministrator.exe</tt>
 +
 +
===Версия 2014.1 of 2015-03-31 (D1+)===
 +
 +
<small><strike>В АРМ Администратор восстановлена работоспособность актуализации (см. [http://irbis.gpntb.ru/read.php?48,94111 обращение на форуме]).</strike></small>
 +
 +
В АРМ Администратор восстановлена работоспособность распараллеливания в процессе отбора (см. [http://irbis.gpntb.ru/read.php?48,95192 обращение на форуме]).
 +
 +
====Список обновлённых файлов в дистрибутиве====
 +
 +
* <tt>Irbis64_FullTextAdministrator.exe</tt>
 +
 +
===Версия 2014.1 of 2015-04-15 (D1+)===
 +
 +
В дистрибутив возвращён АРМ Читатель для полнотекстовых БД полной версии (некоторое время всем пользователям распространялась демо-версия АРМ).
 +
 +
====Список обновлённых файлов в дистрибутиве====
 +
 +
* <tt>Irbis64_FullTextReader.exe</tt>
 +
 +
===Версия 2014.1 of 2015-07-23 (D2)===
 +
 +
В АРМ Администратор восстановлена работоспособность актуализации (см. [http://irbis.gpntb.ru/read.php?48,94111 обращение на форуме]).
 +
 +
Исправлена ошибка, связанная с невозможностью добавить текст в полнотекстовую базу повторно, после того как он был однажды добавлен и удалён.
 +
 +
Также см. [http://irbis.gpntb.ru/read.php?48,97817 ветку о выпуске обновления на форуме].
 +
 +
====Список обновлённых файлов в дистрибутиве====
 +
 +
* <tt>Irbis64_FullTextAdministrator.exe</tt>
 +
* <tt>irbis64.dll</tt>
 +
 +
===Версия 2014.1 of 2015-12-08 (D3)===
 +
 +
Исправлена ошибка в алгоритме формирования словаря.
 +
 +
====Список обновлённых файлов в дистрибутиве====
 +
 +
* <tt>Irbis64_FullTextAdministrator.exe</tt>
  
 
==Ссылки==
 
==Ссылки==

Текущая версия на 18:52, 9 декабря 2015

Содержание

Продукты ИРБИС для работы с полнотекстовыми базами данных

Версия 2014.1 от 2014-12-28

Доработки АРМ Администратор и АРМ Читатель для полнотекстовых БД

Доработка Формы добавления текстов:

  • Обеспечена "отзывчивость" формы для полнотекстовых баз данных со значительным количеством текстов (тысячи). На форме в списке добавленных по умолчанию отображается только часть текстов: в количестве, не превышающем значение, указанное в параметре FT_LIST_PORTION_SIZE секции MAIN (отсутствие параметра эквивалентно указанию 1000). При необходимости показа большего количества текстов можно воспользоваться кнопкой Показать больше текстов.
  • Повышена выразительность: теперь в таблице одному PDF файлу соответствует одна запись (не показывается ссылка на каждую страницу PDF-файла).

Доработки, касающиеся оптимизации процессов включения текстов в ПБД и создания словаря:

  • Оптимизирован процесс создания словаря: при создании словаря текстовый слой сохраняется в БД, если не был сохранён ранее; если текстовый слой ранее был сохранён в БД, то он не извлекается. Это позволяет избежать повторного извлечения текста из тех текстовых документов, из которых он был извлечён ранее. Например, это ускоряет процесс создания словаря при повторном Создании словаря заново (после добавления текстов в БД).
    Для хранения текстового слоя в БД добавлено поле 27.
    Также, если текстовый слой ранее был сохранён в БД, то не обновляются: индекс естественно-тематического классификатора (поле 21), первые строки текста (поле 22), количество слов в тексте (поле 20). Соответственно, утратил актуальность параметр isNeedRefreshBriefText.
  • При включении текста в полнотекстовую базу оптимизирована проверка присутствия текста в БД для многостраничного документа:
    • Определяется номер последней страницы в документе (равный количеству страниц). Если количество страниц не удалось определить (для DJVU не определяется), то номер последней страницы считается равным 1.
    • Если последняя страница присутствует в базе, то считается, что данный многостраничный документ присутствует, и он пропускается.
    • В противном случае производится попытка добавить каждую страницу документа.
  • Для файлов PDF при добавлении документа не производится разбиение на страницы. Впрочем, нельзя однозначно считать это оптимизацией. Поскольку извлечённые страницы сохраняются в кеше (до закрытия АРМ Администратор, или на постоянной основе, если настроен кеш). При построении словаря всё равно возникает необходимость извлекать страницы. Разница в том, процесс отбора может быть многопроцессным. С другой стороны, в зависимости от настроек, при отборе может происходить разбиение на страницы (что быстрее, но теряет силу аргумент ускорения за счёт многопроцессного отбора), или извлекаться отдельные страницы (что значительно медленнее).

Прочие доработки:

  • Текст NO_TEXT_AT_PAGE для нераспознанных страниц и соответствующий параметр.

Изменения схемы полнотекстовой БД

Совместимость с предыдущими версиями

АРМ Администратор, АРМ Читатель для полнотекстовых БД и Веб-шлюз ИРБИС для полнотекстовых БД не совместимы с библиотекой irbis64.dll предыдущих версий.

Библиотека irbis64.dll не совместима с АРМ Администратор, АРМ Читатель для полнотекстовых БД и Веб-шлюз ИРБИС для полнотекстовых БД предыдущих версий.

Список обновлённых файлов в дистрибутиве

  • Irbis64_FullTextAdministrator.exe
  • Irbis64_FullTextReader.exe
  • irbis64.dll

У данных запускаемых файлов и dll отсутствует совместимость с запускаемыми файлами и dll предыдущих версий.

Список изменений в конфигурационных файлах

irbisa_fulltext.ini
[main]
# FT_LIST_PORTION_SIZE - отсутствует в исходной конфигурации

[texts]
# EC_IMPORT_PATH_FORMAT - отсутствует в исходной конфигурации
# NO_TEXT_AT_PAGE - отсутствует в исходной конфигурации
# alwaysRefreshTextRecord - отсутствует в исходной конфигурации
# isNeedRefreshBriefText - утратил актуальность, убран из исходной конфигурации
# method9_tryNotUseDirectDBAccess - утратил актуальность, убран из исходной конфигурации

Версия 2014.1 of 2015-01-21 (D1)

В АРМ Администратор исправлена ошибка создания словаря с символами юникода (внесённая с выпуском версии 2014.1 и обычно проявляющаяся для текстов на языках кроме русского и английского). Для исправления необходимо: обновить версию системы ИРБИС ПБД, для уже созданных баз – создать словарь заново.

В АРМ Читатель для полнотекстовых БД приведён в соответствие отображаемый номер версии.

Список обновлённых файлов в дистрибутиве

  • Irbis64_FullTextAdministrator.exe
  • Irbis64_FullTextReader.exe

Версия 2014.1 of 2015-01-30 (D1+)

Исправлена ошибка в Веб-шлюзе ИРБИС (внесённая с выпуском версии 2014.1; проблемы с постраничным отображением текстов PDF при использовании абсолютных путей).

Для демонстрационной базы словарь создан заново, чтобы обеспечить показ новых возможностей версии 2014.1.

В АРМ Администратор исправлена ошибка - восстановлена возможность удаления текстов из полнотекстовой базы данных.

Список обновлённых файлов в дистрибутиве

  • Irbis64_FullTextAdministrator.exe
  • Демонстрационная полнотекстовая база (файлы базы данных).
  • Файлы Веб-ИРБИС

Изменения в составе дистрибутива от 2015-02-19

Исправлена ошибка, связанная с невозможностью установить веб-шлюз ИРБИС в случае поставки, в которую не входит АРМ Читатель для полнотекстовых БД (см. описание ошибки на форуме).

Теперь в поставку в любом случае входит конфигурационный файл для АРМ Читатель для полнотекстовых БД.

Версия 2014.1 of 2015-02-27 (D1+)

Исправлена ошибка распараллеливания отбора при создании словаря. В дистрибутив включён недостающий файл.

Список обновлённых файлов в дистрибутиве

Добавлен:

  • IrbisMultiLoad.exe

Версия 2014.1 of 2015-03-19 (D1+)

В АРМ Администратор исправлена ошибка, проявляющаяся как отсутствие возможности использовать справочники, размещённые в папке DEPOSIT (см. обращение на форуме).

Список обновлённых файлов в дистрибутиве

  • Irbis64_FullTextAdministrator.exe

Версия 2014.1 of 2015-03-31 (D1+)

В АРМ Администратор восстановлена работоспособность актуализации (см. обращение на форуме).

В АРМ Администратор восстановлена работоспособность распараллеливания в процессе отбора (см. обращение на форуме).

Список обновлённых файлов в дистрибутиве

  • Irbis64_FullTextAdministrator.exe

Версия 2014.1 of 2015-04-15 (D1+)

В дистрибутив возвращён АРМ Читатель для полнотекстовых БД полной версии (некоторое время всем пользователям распространялась демо-версия АРМ).

Список обновлённых файлов в дистрибутиве

  • Irbis64_FullTextReader.exe

Версия 2014.1 of 2015-07-23 (D2)

В АРМ Администратор восстановлена работоспособность актуализации (см. обращение на форуме).

Исправлена ошибка, связанная с невозможностью добавить текст в полнотекстовую базу повторно, после того как он был однажды добавлен и удалён.

Также см. ветку о выпуске обновления на форуме.

Список обновлённых файлов в дистрибутиве

  • Irbis64_FullTextAdministrator.exe
  • irbis64.dll

Версия 2014.1 of 2015-12-08 (D3)

Исправлена ошибка в алгоритме формирования словаря.

Список обновлённых файлов в дистрибутиве

  • Irbis64_FullTextAdministrator.exe

Ссылки

См. также: