Список изменений ИРБИС версии 2014.1

Содержание

1 Продукты ИРБИС для работы с полнотекстовыми базами данных
- 1.1 Версия 2014.1 (в разработке)
2 Ссылки

Продукты ИРБИС для работы с полнотекстовыми базами данных

Версия 2014.1 (в разработке)

Доработки АРМ Администратор и АРМ Читатель для полнотекстовых БД

Доработка Формы добавления текстов:

Обеспечена "отзывчивость" формы для полнотекстовых баз данных со значительным количеством текстов (тысячи). На форме в списке добавленных по умолчанию отображается только часть текстов: в количестве, не превышающем значение, указанное в параметре FT_LIST_PORTION_SIZE секции MAIN (отсутствие параметра эквивалентно указанию 1000). При необходимости показа большего количества текстов можно воспользоваться кнопкой Показать больше текстов.

Повышена выразительность: теперь в таблице одному PDF файлу соответствует одна запись (не показывается ссылка на каждую страницу PDF-файла).

Доработки, касающиеся оптимизации процессов включения текстов в ПБД и создания словаря:

Оптимизирован процесс создания словаря: при создании словаря текстовый слой сохраняется в БД, если не был сохранён ранее; если текстовый слой ранее был сохранён в БД, то он не извлекается. Это позволяет избежать повторного извлечения текста из тех текстовых документов, из которых он был извлечён ранее. Например, это ускоряет процесс создания словаря при повторном Создании словаря заново (после добавления текстов в БД).
Для хранения текстового слоя в БД добавлено поле 27.
Также, если текстовый слой ранее был сохранён в БД, то не обновляются: индекс естественно-тематического классификатора (поле 21), первые строки текста (поле 22), количество слов в тексте (поле 20). Соответственно, утратил актуальность параметр isNeedRefreshBriefText.

Алгоритм импорта текстов из электронного каталога изменён таким образом, что ссылки могут быть сгенерированы в соответствии с указанным форматом. См. подраздел Алгоритм получения ссылок из базы данных электронного каталога статьи Включение текстов в полнотекстовую базу данных.

При включении текста в полнотекстовую базу оптимизирована проверка присутствия текста в БД для многостраничного документа:
- Определяется номер последней страницы в документе (равный количеству страниц). Если количество страниц не удалось определить (для DJVU не определяется), то номер последней страницы считается равным 1.
- Если последняя страница присутствует в базе, то считается, что данный многостраничный документ присутствует, и он пропускается.
- В противном случае производится попытка добавить каждую страницу документа.

Для файлов PDF при добавлении документа не производится разбиение на страницы. Впрочем, нельзя однозначно считать это оптимизацией. Поскольку извлечённые страницы сохраняются в кеше (до закрытия АРМ Администратор, или на постоянной основе, если настроен кеш). При построении словаря всё равно возникает необходимость извлекать страницы. Разница в том, процесс отбора может быть многопроцессным. С другой стороны, в зависимости от настроек, при отборе может происходить разбиение на страницы (что быстрее, но теряет силу аргумент ускорения за счёт многопроцессного отбора), или извлекаться отдельные страницы (что значительно медленнее).

Прочие доработки:

Текст NO_TEXT_AT_PAGE для нераспознанных страниц и соответствующий параметр.

Изменения схемы полнотекстовой БД

Добавлено поле 27.

Список обновлённых файлов в дистрибутиве

Irbis64_FullTextAdministrator.exe
Irbis64_FullTextReader.exe
irbis64.dll

У данных запускаемых файлов и dll отсутствует совместимость с запускаемыми файлами и dll предыдущих версий.

Список изменений в конфигурационных файлах

`irbisa_fulltext.ini`

[main]
# FT_LIST_PORTION_SIZE - отсутствует в исходной конфигурации

[texts]
# EC_IMPORT_PATH_FORMAT - отсутствует в исходной конфигурации
# NO_TEXT_AT_PAGE - отсутствует в исходной конфигурации
# isNeedRefreshBriefText - утрачивает актуальность, убран из исходной конфигурации

Ссылки

См. также:

Список изменений ИРБИС версии 2014.1

Содержание

Продукты ИРБИС для работы с полнотекстовыми базами данных

Версия 2014.1 (в разработке)

Доработки АРМ Администратор и АРМ Читатель для полнотекстовых БД

Изменения схемы полнотекстовой БД

Список обновлённых файлов в дистрибутиве

Список изменений в конфигурационных файлах

`irbisa_fulltext.ini`

Ссылки

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты