Список изменений ИРБИС версии 2014.1 — различия между версиями
Sokv (обсуждение | вклад) |
Sokv (обсуждение | вклад) |
||
(не показано 17 промежуточных версий этого же участника) | |||
Строка 1: | Строка 1: | ||
==Продукты ИРБИС для работы с полнотекстовыми базами данных== | ==Продукты ИРБИС для работы с полнотекстовыми базами данных== | ||
− | ===Версия 2014.1 | + | ===Версия 2014.1 от 2014-12-28=== |
− | ====Доработки==== | + | ====Доработки АРМ Администратор и АРМ Читатель для полнотекстовых БД==== |
− | + | '''Доработка ''Формы добавления текстов'':''' | |
− | + | * Обеспечена "отзывчивость" формы для полнотекстовых баз данных со значительным количеством текстов (тысячи). На форме в списке добавленных по умолчанию отображается только часть текстов: в количестве, не превышающем значение, указанное в параметре <tt>FT_LIST_PORTION_SIZE</tt> секции <tt>MAIN</tt> (отсутствие параметра эквивалентно указанию 1000). При необходимости показа большего количества текстов можно воспользоваться кнопкой ''Показать больше текстов''. | |
− | + | * Повышена выразительность: теперь в таблице одному PDF файлу соответствует одна запись (не показывается ссылка на каждую страницу PDF-файла). | |
− | |||
− | |||
− | * | + | '''Доработки, касающиеся оптимизации процессов включения текстов в ПБД и создания словаря:''' |
+ | |||
+ | * Оптимизирован процесс создания словаря: при создании словаря текстовый слой сохраняется в БД, если не был сохранён ранее; если текстовый слой ранее был сохранён в БД, то он не извлекается. Это позволяет избежать повторного извлечения текста из тех текстовых документов, из которых он был извлечён ранее. Например, это ускоряет процесс создания словаря при повторном ''Создании словаря заново'' (после добавления текстов в БД).<br/>Для хранения текстового слоя в БД [[#Изменения схемы полнотекстовой БД|добавлено поле 27]].<br/>Также, если текстовый слой ранее был сохранён в БД, то не обновляются: индекс естественно-тематического классификатора (поле 21), первые строки текста (поле 22), количество слов в тексте (поле 20). Соответственно, утратил актуальность параметр <tt>isNeedRefreshBriefText</tt>. | ||
+ | |||
+ | * Алгоритм [[Включение текстов в полнотекстовую базу данных#Включение в полнотекстовую базу текстов из базы данных электронного каталога|импорта текстов из электронного каталога]] изменён таким образом, что ссылки могут быть сгенерированы в соответствии с указанным форматом. См. [[Включение текстов в полнотекстовую базу данных#Алгоритм получения ссылок из базы данных электронного каталога|подраздел ''Алгоритм получения ссылок из базы данных электронного каталога'' статьи ''Включение текстов в полнотекстовую базу данных'']]. | ||
+ | |||
+ | * При включении текста в полнотекстовую базу [[Включение текстов в полнотекстовую базу данных#Исключение повторного добавления текстов|оптимизирована проверка присутствия текста в БД для многостраничного документа]]: | ||
+ | ** Определяется номер последней страницы в документе (равный количеству страниц). Если количество страниц не удалось определить (для DJVU не определяется), то номер последней страницы считается равным 1. | ||
+ | ** Если последняя страница присутствует в базе, то считается, что данный многостраничный документ присутствует, и он пропускается. | ||
+ | ** В противном случае производится попытка добавить каждую страницу документа. | ||
+ | |||
+ | * Для файлов PDF при добавлении документа не производится разбиение на страницы. Впрочем, нельзя однозначно считать это оптимизацией. Поскольку извлечённые страницы сохраняются в кеше (до закрытия АРМ Администратор, или на постоянной основе, если настроен кеш). При построении словаря всё равно возникает необходимость извлекать страницы. Разница в том, процесс отбора может быть многопроцессным. С другой стороны, в зависимости от настроек, при отборе может происходить разбиение на страницы (что быстрее, но теряет силу аргумент ускорения за счёт многопроцессного отбора), или извлекаться отдельные страницы (что значительно медленнее). | ||
+ | |||
+ | '''Прочие доработки:''' | ||
+ | |||
+ | * Текст NO_TEXT_AT_PAGE для нераспознанных страниц и соответствующий параметр. | ||
+ | |||
+ | ====Изменения схемы полнотекстовой БД==== | ||
+ | |||
+ | * [[Добавлено поле 27.]] | ||
+ | |||
+ | ====Совместимость с предыдущими версиями==== | ||
+ | |||
+ | АРМ Администратор, АРМ Читатель для полнотекстовых БД и Веб-шлюз ИРБИС для полнотекстовых БД не совместимы с библиотекой <tt>irbis64.dll</tt> предыдущих версий. | ||
+ | |||
+ | Библиотека <tt>irbis64.dll</tt> не совместима с АРМ Администратор, АРМ Читатель для полнотекстовых БД и Веб-шлюз ИРБИС для полнотекстовых БД предыдущих версий. | ||
+ | |||
+ | ====Список обновлённых файлов в дистрибутиве==== | ||
+ | |||
+ | * <tt>Irbis64_FullTextAdministrator.exe</tt> | ||
+ | * <tt>Irbis64_FullTextReader.exe</tt> | ||
+ | * <tt>irbis64.dll</tt> | ||
+ | |||
+ | У данных запускаемых файлов и dll отсутствует совместимость с запускаемыми файлами и dll предыдущих версий. | ||
+ | |||
+ | ====Список изменений в конфигурационных файлах==== | ||
+ | |||
+ | =====<tt>irbisa_fulltext.ini</tt>===== | ||
+ | |||
+ | [main] | ||
+ | # FT_LIST_PORTION_SIZE - отсутствует в исходной конфигурации | ||
+ | |||
+ | [texts] | ||
+ | # EC_IMPORT_PATH_FORMAT - отсутствует в исходной конфигурации | ||
+ | # NO_TEXT_AT_PAGE - отсутствует в исходной конфигурации | ||
+ | # alwaysRefreshTextRecord - отсутствует в исходной конфигурации | ||
+ | # isNeedRefreshBriefText - утратил актуальность, убран из исходной конфигурации | ||
+ | # method9_tryNotUseDirectDBAccess - утратил актуальность, убран из исходной конфигурации | ||
+ | |||
+ | ===Версия 2014.1 of 2015-01-21 (D1)=== | ||
+ | |||
+ | В АРМ Администратор исправлена ошибка создания словаря с символами юникода (внесённая с выпуском версии 2014.1 и обычно проявляющаяся для текстов на языках кроме русского и английского). Для исправления необходимо: обновить версию системы ИРБИС ПБД, для уже созданных баз – создать словарь заново. | ||
+ | |||
+ | В АРМ Читатель для полнотекстовых БД приведён в соответствие отображаемый номер версии. | ||
+ | |||
+ | ====Список обновлённых файлов в дистрибутиве==== | ||
+ | |||
+ | * <tt>Irbis64_FullTextAdministrator.exe</tt> | ||
+ | * <tt>Irbis64_FullTextReader.exe</tt> | ||
+ | |||
+ | ===Версия 2014.1 of 2015-01-30 (D1+)=== | ||
+ | |||
+ | Исправлена ошибка в Веб-шлюзе ИРБИС (внесённая с выпуском версии 2014.1; проблемы с постраничным отображением текстов PDF при использовании абсолютных путей). | ||
+ | |||
+ | Для демонстрационной базы словарь создан заново, чтобы обеспечить показ новых возможностей версии 2014.1. | ||
+ | |||
+ | В АРМ Администратор исправлена ошибка - восстановлена возможность удаления текстов из полнотекстовой базы данных. | ||
+ | |||
+ | ====Список обновлённых файлов в дистрибутиве==== | ||
+ | |||
+ | * <tt>Irbis64_FullTextAdministrator.exe</tt> | ||
+ | * Демонстрационная полнотекстовая база (файлы базы данных). | ||
+ | * Файлы Веб-ИРБИС | ||
+ | |||
+ | ===Изменения в составе дистрибутива от 2015-02-19=== | ||
+ | |||
+ | Исправлена ошибка, связанная с невозможностью установить веб-шлюз ИРБИС в случае поставки, в которую не входит АРМ Читатель для полнотекстовых БД (см. [http://irbis.gpntb.ru/read.php?48,93002 описание ошибки на форуме]). | ||
+ | |||
+ | Теперь в поставку в любом случае входит конфигурационный файл для АРМ Читатель для полнотекстовых БД. | ||
+ | |||
+ | ===Версия 2014.1 of 2015-02-27 (D1+)=== | ||
+ | |||
+ | Исправлена ошибка распараллеливания отбора при создании словаря. В дистрибутив включён недостающий файл. | ||
+ | |||
+ | ====Список обновлённых файлов в дистрибутиве==== | ||
+ | |||
+ | Добавлен: | ||
+ | * <tt>IrbisMultiLoad.exe</tt> | ||
+ | |||
+ | ===Версия 2014.1 of 2015-03-19 (D1+)=== | ||
+ | |||
+ | В АРМ Администратор исправлена ошибка, проявляющаяся как отсутствие возможности использовать справочники, размещённые в папке DEPOSIT (см. [http://irbis.gpntb.ru/read.php?48,95192 обращение на форуме]). | ||
+ | |||
+ | ====Список обновлённых файлов в дистрибутиве==== | ||
+ | |||
+ | * <tt>Irbis64_FullTextAdministrator.exe</tt> | ||
+ | |||
+ | ===Версия 2014.1 of 2015-03-31 (D1+)=== | ||
+ | |||
+ | <small><strike>В АРМ Администратор восстановлена работоспособность актуализации (см. [http://irbis.gpntb.ru/read.php?48,94111 обращение на форуме]).</strike></small> | ||
+ | |||
+ | В АРМ Администратор восстановлена работоспособность распараллеливания в процессе отбора (см. [http://irbis.gpntb.ru/read.php?48,95192 обращение на форуме]). | ||
+ | |||
+ | ====Список обновлённых файлов в дистрибутиве==== | ||
+ | |||
+ | * <tt>Irbis64_FullTextAdministrator.exe</tt> | ||
+ | |||
+ | ===Версия 2014.1 of 2015-04-15 (D1+)=== | ||
+ | |||
+ | В дистрибутив возвращён АРМ Читатель для полнотекстовых БД полной версии (некоторое время всем пользователям распространялась демо-версия АРМ). | ||
+ | |||
+ | ====Список обновлённых файлов в дистрибутиве==== | ||
+ | |||
+ | * <tt>Irbis64_FullTextReader.exe</tt> | ||
+ | |||
+ | ===Версия 2014.1 of 2015-07-23 (D2)=== | ||
+ | |||
+ | В АРМ Администратор восстановлена работоспособность актуализации (см. [http://irbis.gpntb.ru/read.php?48,94111 обращение на форуме]). | ||
+ | |||
+ | Исправлена ошибка, связанная с невозможностью добавить текст в полнотекстовую базу повторно, после того как он был однажды добавлен и удалён. | ||
+ | |||
+ | Также см. [http://irbis.gpntb.ru/read.php?48,97817 ветку о выпуске обновления на форуме]. | ||
+ | |||
+ | ====Список обновлённых файлов в дистрибутиве==== | ||
+ | |||
+ | * <tt>Irbis64_FullTextAdministrator.exe</tt> | ||
+ | * <tt>irbis64.dll</tt> | ||
+ | |||
+ | ===Версия 2014.1 of 2015-12-08 (D3)=== | ||
+ | |||
+ | Исправлена ошибка в алгоритме формирования словаря. | ||
+ | |||
+ | ====Список обновлённых файлов в дистрибутиве==== | ||
+ | |||
+ | * <tt>Irbis64_FullTextAdministrator.exe</tt> | ||
==Ссылки== | ==Ссылки== |
Текущая версия на 18:52, 9 декабря 2015
Содержание
- 1 Продукты ИРБИС для работы с полнотекстовыми базами данных
- 1.1 Версия 2014.1 от 2014-12-28
- 1.2 Версия 2014.1 of 2015-01-21 (D1)
- 1.3 Версия 2014.1 of 2015-01-30 (D1+)
- 1.4 Изменения в составе дистрибутива от 2015-02-19
- 1.5 Версия 2014.1 of 2015-02-27 (D1+)
- 1.6 Версия 2014.1 of 2015-03-19 (D1+)
- 1.7 Версия 2014.1 of 2015-03-31 (D1+)
- 1.8 Версия 2014.1 of 2015-04-15 (D1+)
- 1.9 Версия 2014.1 of 2015-07-23 (D2)
- 1.10 Версия 2014.1 of 2015-12-08 (D3)
- 2 Ссылки
Продукты ИРБИС для работы с полнотекстовыми базами данных
Версия 2014.1 от 2014-12-28
Доработки АРМ Администратор и АРМ Читатель для полнотекстовых БД
Доработка Формы добавления текстов:
- Обеспечена "отзывчивость" формы для полнотекстовых баз данных со значительным количеством текстов (тысячи). На форме в списке добавленных по умолчанию отображается только часть текстов: в количестве, не превышающем значение, указанное в параметре FT_LIST_PORTION_SIZE секции MAIN (отсутствие параметра эквивалентно указанию 1000). При необходимости показа большего количества текстов можно воспользоваться кнопкой Показать больше текстов.
- Повышена выразительность: теперь в таблице одному PDF файлу соответствует одна запись (не показывается ссылка на каждую страницу PDF-файла).
Доработки, касающиеся оптимизации процессов включения текстов в ПБД и создания словаря:
- Оптимизирован процесс создания словаря: при создании словаря текстовый слой сохраняется в БД, если не был сохранён ранее; если текстовый слой ранее был сохранён в БД, то он не извлекается. Это позволяет избежать повторного извлечения текста из тех текстовых документов, из которых он был извлечён ранее. Например, это ускоряет процесс создания словаря при повторном Создании словаря заново (после добавления текстов в БД).
Для хранения текстового слоя в БД добавлено поле 27.
Также, если текстовый слой ранее был сохранён в БД, то не обновляются: индекс естественно-тематического классификатора (поле 21), первые строки текста (поле 22), количество слов в тексте (поле 20). Соответственно, утратил актуальность параметр isNeedRefreshBriefText.
- Алгоритм импорта текстов из электронного каталога изменён таким образом, что ссылки могут быть сгенерированы в соответствии с указанным форматом. См. подраздел Алгоритм получения ссылок из базы данных электронного каталога статьи Включение текстов в полнотекстовую базу данных.
- При включении текста в полнотекстовую базу оптимизирована проверка присутствия текста в БД для многостраничного документа:
- Определяется номер последней страницы в документе (равный количеству страниц). Если количество страниц не удалось определить (для DJVU не определяется), то номер последней страницы считается равным 1.
- Если последняя страница присутствует в базе, то считается, что данный многостраничный документ присутствует, и он пропускается.
- В противном случае производится попытка добавить каждую страницу документа.
- Для файлов PDF при добавлении документа не производится разбиение на страницы. Впрочем, нельзя однозначно считать это оптимизацией. Поскольку извлечённые страницы сохраняются в кеше (до закрытия АРМ Администратор, или на постоянной основе, если настроен кеш). При построении словаря всё равно возникает необходимость извлекать страницы. Разница в том, процесс отбора может быть многопроцессным. С другой стороны, в зависимости от настроек, при отборе может происходить разбиение на страницы (что быстрее, но теряет силу аргумент ускорения за счёт многопроцессного отбора), или извлекаться отдельные страницы (что значительно медленнее).
Прочие доработки:
- Текст NO_TEXT_AT_PAGE для нераспознанных страниц и соответствующий параметр.
Изменения схемы полнотекстовой БД
Совместимость с предыдущими версиями
АРМ Администратор, АРМ Читатель для полнотекстовых БД и Веб-шлюз ИРБИС для полнотекстовых БД не совместимы с библиотекой irbis64.dll предыдущих версий.
Библиотека irbis64.dll не совместима с АРМ Администратор, АРМ Читатель для полнотекстовых БД и Веб-шлюз ИРБИС для полнотекстовых БД предыдущих версий.
Список обновлённых файлов в дистрибутиве
- Irbis64_FullTextAdministrator.exe
- Irbis64_FullTextReader.exe
- irbis64.dll
У данных запускаемых файлов и dll отсутствует совместимость с запускаемыми файлами и dll предыдущих версий.
Список изменений в конфигурационных файлах
irbisa_fulltext.ini
[main] # FT_LIST_PORTION_SIZE - отсутствует в исходной конфигурации [texts] # EC_IMPORT_PATH_FORMAT - отсутствует в исходной конфигурации # NO_TEXT_AT_PAGE - отсутствует в исходной конфигурации # alwaysRefreshTextRecord - отсутствует в исходной конфигурации # isNeedRefreshBriefText - утратил актуальность, убран из исходной конфигурации # method9_tryNotUseDirectDBAccess - утратил актуальность, убран из исходной конфигурации
Версия 2014.1 of 2015-01-21 (D1)
В АРМ Администратор исправлена ошибка создания словаря с символами юникода (внесённая с выпуском версии 2014.1 и обычно проявляющаяся для текстов на языках кроме русского и английского). Для исправления необходимо: обновить версию системы ИРБИС ПБД, для уже созданных баз – создать словарь заново.
В АРМ Читатель для полнотекстовых БД приведён в соответствие отображаемый номер версии.
Список обновлённых файлов в дистрибутиве
- Irbis64_FullTextAdministrator.exe
- Irbis64_FullTextReader.exe
Версия 2014.1 of 2015-01-30 (D1+)
Исправлена ошибка в Веб-шлюзе ИРБИС (внесённая с выпуском версии 2014.1; проблемы с постраничным отображением текстов PDF при использовании абсолютных путей).
Для демонстрационной базы словарь создан заново, чтобы обеспечить показ новых возможностей версии 2014.1.
В АРМ Администратор исправлена ошибка - восстановлена возможность удаления текстов из полнотекстовой базы данных.
Список обновлённых файлов в дистрибутиве
- Irbis64_FullTextAdministrator.exe
- Демонстрационная полнотекстовая база (файлы базы данных).
- Файлы Веб-ИРБИС
Изменения в составе дистрибутива от 2015-02-19
Исправлена ошибка, связанная с невозможностью установить веб-шлюз ИРБИС в случае поставки, в которую не входит АРМ Читатель для полнотекстовых БД (см. описание ошибки на форуме).
Теперь в поставку в любом случае входит конфигурационный файл для АРМ Читатель для полнотекстовых БД.
Версия 2014.1 of 2015-02-27 (D1+)
Исправлена ошибка распараллеливания отбора при создании словаря. В дистрибутив включён недостающий файл.
Список обновлённых файлов в дистрибутиве
Добавлен:
- IrbisMultiLoad.exe
Версия 2014.1 of 2015-03-19 (D1+)
В АРМ Администратор исправлена ошибка, проявляющаяся как отсутствие возможности использовать справочники, размещённые в папке DEPOSIT (см. обращение на форуме).
Список обновлённых файлов в дистрибутиве
- Irbis64_FullTextAdministrator.exe
Версия 2014.1 of 2015-03-31 (D1+)
В АРМ Администратор восстановлена работоспособность актуализации (см. обращение на форуме).
В АРМ Администратор восстановлена работоспособность распараллеливания в процессе отбора (см. обращение на форуме).
Список обновлённых файлов в дистрибутиве
- Irbis64_FullTextAdministrator.exe
Версия 2014.1 of 2015-04-15 (D1+)
В дистрибутив возвращён АРМ Читатель для полнотекстовых БД полной версии (некоторое время всем пользователям распространялась демо-версия АРМ).
Список обновлённых файлов в дистрибутиве
- Irbis64_FullTextReader.exe
Версия 2014.1 of 2015-07-23 (D2)
В АРМ Администратор восстановлена работоспособность актуализации (см. обращение на форуме).
Исправлена ошибка, связанная с невозможностью добавить текст в полнотекстовую базу повторно, после того как он был однажды добавлен и удалён.
Также см. ветку о выпуске обновления на форуме.
Список обновлённых файлов в дистрибутиве
- Irbis64_FullTextAdministrator.exe
- irbis64.dll
Версия 2014.1 of 2015-12-08 (D3)
Исправлена ошибка в алгоритме формирования словаря.
Список обновлённых файлов в дистрибутиве
- Irbis64_FullTextAdministrator.exe
Ссылки
См. также: