Список изменений ИРБИС версии 2013.1 — различия между версиями
Sokv (обсуждение | вклад) (→Ссылки) |
Sokv (обсуждение | вклад) |
||
Строка 54: | Строка 54: | ||
* В АРМ Администратор доработан механизм создания словаря: появилась возможность распараллеливания, отбор может осуществляться параллельно несколькими процессами. Для указания количества процессов при создании словаря в [[Конфигурационные параметры ИРБИС для полнотекстовых БД|конфигурационном файле АРМ Администратор ИРБИС]] введён параметр <tt>MULTILOAD</tt>. | * В АРМ Администратор доработан механизм создания словаря: появилась возможность распараллеливания, отбор может осуществляться параллельно несколькими процессами. Для указания количества процессов при создании словаря в [[Конфигурационные параметры ИРБИС для полнотекстовых БД|конфигурационном файле АРМ Администратор ИРБИС]] введён параметр <tt>MULTILOAD</tt>. | ||
− | * В АРМ Администратор доработан механизм индексирования по методу 9 – реализована возможность [[ | + | * В АРМ Администратор доработан механизм индексирования по методу 9 – реализована возможность [[Полнотекстовая база данных (вид баз данных ИРБИС)#Получение ссылки при использовании метода индексирования 9|получения ссылки (пути) на индексируемый файл]] исключительно посредством ТВП (без непосредственного обращения к БД). Также оставлена возможность получения ссылки способом, реализованным в предыдущих версиях ИРБИС. Для включения/выключения данной возможности предназначен параметр <tt>method9_tryNotUseDirectDBAccess</tt> (описание параметра см. в статье [[Конфигурационные параметры ИРБИС для полнотекстовых БД]]). |
''Примечание: Данная доработка также реализована в последних [[Отличия ИРБИС 2012.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|обновлениях версий 2012.1]] и [[Отличия ИРБИС 2011.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|2011.1]]''. | ''Примечание: Данная доработка также реализована в последних [[Отличия ИРБИС 2012.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|обновлениях версий 2012.1]] и [[Отличия ИРБИС 2011.1 от предыдущей версии#Продукты ИРБИС для работы с полнотекстовыми базами данных|2011.1]]''. |
Версия 14:03, 30 мая 2014
Содержание
- 1 Продукты ИРБИС для работы с полнотекстовыми базами данных
- 1.1 Выпуск и обозначение обновлений
- 1.2 Версия 2013.1 от 2013.11.01
- 1.2.1 Доработки АРМ Администратор и АРМ Читатель для полнотекстовых БД
- 1.2.2 Доработки Веб-шлюза ИРБИС для полнотекстовых БД
- 1.2.3 Изменение порядка включения текстов в полнотекстовую БД
- 1.2.4 Другие изменения АРМ Администратор и АРМ Читатель для полнотекстовых БД
- 1.2.5 Список обновлённых файлов в дистрибутиве
- 1.2.6 Список изменений в конфигурационных файлах
- 1.3 Версия 2013.1 of 2014-03-12 (D1)
- 1.4 Версия 2013.1 of 2014-04-22 (D1+)
- 1.5 Версия 2013.1 of 2014-05-28 (D1+)
- 2 irbis64.dll
- 3 Редактор ISO/MST файлов
- 4 Ссылки
Продукты ИРБИС для работы с полнотекстовыми базами данных
Выпуск и обозначение обновлений
Общую информацию о выпуске версий и обновлений ИРБИС для ПБД см. в соответствующем подразделе ЧАВО по работе с ИРБИС.
Обозначение версии присутствует:
- в окне, появляющемся на экране во время запуска АРМ Администратор для ПБД и АРМ Читатель для ПБД.
Начиная с версии 2013.1 of 2014-04-22 (D1+) обозначение версии также присутствует:
- в имени файла дистрибутива;
- в специальном информационном окне АРМ Администратор и АРМ Читатель (главное меню, пункт О программе...).
В распространяемых дистрибутивах (а также обновлениях) номер версии сопровождается датой выпуска (yyyy.mm.dd) и имеет следующий вид:
YYYY.N of yyyy.mm.dd
Например:
Версия 2013.1 от 2013.11.01
При выпуске обновлений номер версии сопровождается также номером обновления и имеет следующий вид:
YYYY.N of yyyy.mm.dd (DX)
где
- X в DX является номером обновления, например: D1, D2 и т.д.
Номер обновления присваивается критическим или важным обновлениям, например:
Версия 2013.1 of 2014-03-12 (D1)
Прочие (необязательные) обновления обозначаются знаком +, не имеют самостоятельного номера, и отличаются датой выпуска, например:
Версия 2013.1 of 2014-04-22 (D1+)
Установка и обновление ИРБИС для ПБД с использованием дистрибутивов и обновлений
Варианты установок и обновлений:
- Новая установка.
- Обновление предыдущей версии.
- Обновление текущей версии.
См. Развёртывание программного обеспечения ИРБИС 64 для полнотекстовых баз данных и Инструкция по переходу на новую версию программного обеспечения ИРБИС 64.
Версия 2013.1 от 2013.11.01
Доработки АРМ Администратор и АРМ Читатель для полнотекстовых БД
- В АРМ Читатель доработана функция полнотекстового поиска – реализована возможность поиска с учётом морфологии слов.
Механизм морфологии является альтернативой механизму правого усечения (который применяется в полнотекстовом поиске в версиях ниже 2013.1) и обеспечивает более точный поиск.
Пример: Выполняется полнотекстовый поиск по слову "СТОЛ". В случае применения правого усечения (как это происходило до сих пор) будут найдены документы, содержащие все флексии слова "СТОЛ" (стола, столу, столы, столами и т.д.), а также документы, содержащие слова "СТОЛБ", "СТОЛИЦА" (и все их формы) - что, конечно же, будет являться "шумом". В случае применения механизма морфологии - будут найдены ТОЛЬКО документы, содержащие слово "СТОЛ" и все его формы.
Включение/выключение данной возможности осуществляется в окне настроек при помощи опции Поиск с морфологическим разбором слов. Данная опция сохраняется в конфигурационном файле АРМ Читатель для полнотекстовых БД в параметре FullTextMorphology.
- В АРМ Читатель реализована возможность выдачи результатов поиска с группировкой найденных страниц по исходному документу. Для включения/выключения данной возможности в конфигурационном файле АРМ Читатель для полнотекстовых БД введён параметр USE_TAGS_IN_SEARCH. Дополнительно введены параметры: Field_NUM_PAGES и Field_NUM_MFNS.
- В АРМ Администратор доработан механизм создания словаря: появилась возможность распараллеливания, отбор может осуществляться параллельно несколькими процессами. Для указания количества процессов при создании словаря в конфигурационном файле АРМ Администратор ИРБИС введён параметр MULTILOAD.
- В АРМ Администратор доработан механизм индексирования по методу 9 – реализована возможность получения ссылки (пути) на индексируемый файл исключительно посредством ТВП (без непосредственного обращения к БД). Также оставлена возможность получения ссылки способом, реализованным в предыдущих версиях ИРБИС. Для включения/выключения данной возможности предназначен параметр method9_tryNotUseDirectDBAccess (описание параметра см. в статье Конфигурационные параметры ИРБИС для полнотекстовых БД).
Примечание: Данная доработка также реализована в последних обновлениях версий 2012.1 и 2011.1.
- В АРМ Администратор изменён механизм включения текстов из электронного каталога. Отменена возможность включения файлов PDF и DJVU без разбиения на страницы. Многостраничные файлы PDF и DJVU включаются в полнотекстовую базу данных только с разбиением на страницы.
- Реализована возможность прикреплять описания Dublin Core к многостраничным документам, добавленным к БД с разбиением на страницы. Описание Dublin Core прикрепляется к записи полнотекстовой БД, соответствующей первой странице документа. Другие страницы связываются с описанием Dublin Core посредством записи словаря (инвертированного файла); для установления связи используется подполе 952^b.
- Реализовано добавление текстов PDF из электронного каталога с разбиением на страницы. Описание Dublin Core создаётся на основе библиографического описания, и прикрепляется к записи полнотекстовой БД, соответствующей первой странице документа.
- В АРМ Читатель постраничный просмотр PDF файлов реализован на основе HTML-страницы, выступающей в роли шаблона. Для указания шаблона в конфигурационном файле АРМ Читатель для полнотекстовых БД добавлен параметр jpgViewerFilename. Комментарий: на основе данного шаблона реализована возможность изменения масштаба в окне постраничного просмотра PDF файлов (см. описание ниже).
- В АРМ Читатель в окне постраничного просмотра PDF файлов добавлена возможность изменения масштаба просматриваемой страницы.
Доработки Веб-шлюза ИРБИС для полнотекстовых БД
- Создан новый дизайн пользовательского интерфейса.
- Изменился способ показа в результатах поиска найденных страниц из многостраничных документов. В результатах поиска показывается только первая найденная (самая релевантная) страница многостраничного документа вместе со ссылками на другие найденные страницы в порядке релевантности. То есть любой текст в результатах поиска отражается только один раз.
- Формат показа многостраничного документа теперь включает текст начала документа.
- Изменен формат постраничного листания многостраничного документа PDF.
Изменение порядка включения текстов в полнотекстовую БД
Новые возможности версии 2013.1
- Концепция местоположения внешних ресурсов (текстов) позволяет использовать относительные ссылки на одни и те же тексты в разных БД (например, в БД ЭК и полнотекстовой). Достаточно в 11 строке соответствующих .par файлов указать одинаковое местоположение внешних ресурсов.
- При использовании относительных ссылок местоположение текстов на файловой системе может быть легко изменено, при этом достаточно поменять путь в 11 строке .par файла(ов).
Ограничения, вводимые с версии 2013.1
Запрещено указание путей, начинающихся с буквы диска. Следует указывать пути UNC (например: \\ComputerName\SharedFolder\Resource.pdf).
По умолчанию, при включении текстов по абсолютным путям, разрешено указывать только ЛОКАЛЬНЫЕ пути UNC (запрещено включать тексты с других компьютеров в локальной сети). Для включения/выключения данного ограничения в конфигурационном файле АРМ Администратор ИРБИС введён параметр onlyLocalUncPath.
Рекомендации по включению текстов в полнотекстовую БД
Размещать внешние ресурсы (тексты) следует локально (на том же компьютере, где установлен ИРБИС для полнотекстовых БД).
При включении текстов в полнотекстовую БД предпочтительно использование относительных путей.
Рекомендуется выбрать одно местоположение внешних ресурсов (текстов), указать его В 11 строке .par файла, и при включении текстов в полнотекстовую базу использовать относительные пути.
В 11 строке .par файла в качестве пути рекомендуется использовать:
- относительный путь, начинающийся с точки или
- UNC-путь к файлу (например: \\ComputerName\SharedFolder\Resource.pdf)
Только при невозможности размещения внешних ресурсов (текстов) внутри одной папки при включении текстов в полнотекстовую БД следует использовать абсолютные пути.
Другие изменения АРМ Администратор и АРМ Читатель для полнотекстовых БД
- По умолчанию включено построение тематического словаря. В конфигурационном файле irbisa_fulltext.ini в исходной конфигурации убран параметр isSboychakovThemeDictionaryEnable; изменено умолчание для случая отсутствия данного параметра в конфигурационном файле.
Список обновлённых файлов в дистрибутиве
- Irbis64_FullTextAdministrator.exe
- Irbis64_FullTextReader.exe
- irbis64.dll с форматным выходом +9S
- ТВП для инвертированного файла полнотекстовой БД
- extra_unifor.dll
- sr.js, search_header.pft, BriefHTML_web_brief.pft, BriefHTML_mfn.pft, search_empty.pft, BriefHTML_web_nearmfn.pft, bottom_string.pft
- jpgViewer.html
Список изменений в конфигурационных файлах
irbisa_fulltext.ini
[main] # isSboychakovThemeDictionaryEnable - убран из исходной конфигурации MULTILOAD=1
irbisr_fulltext.ini
[main] # Включение/выключение возможности поиска с учётом морфологии слов (сохраняет значение опции Поиск с морфологическим разбором слов). FullTextMorphology=1 # Включение/выключение возможности выдачи результатов поиска с группировкой найденных страниц по исходному документу. USE_TAGS_IN_SEARCH=1 # Имя шаблона HTML-страницы, используемой для показа страницы PDF-документа. jpgViewerFilename=.\jpgViewer.html [VirtualFields] Field_NUM_PAGES=3500 Field_NUM_MFNS=3501 [DESKTOP] Panel_DictionGrid_Visible=0
Версия 2013.1 of 2014-03-12 (D1)
Список обновлённых файлов в данной версии ИРБИС ПБД:
- Irbis64_FullTextAdministrator.exe (АРМ Администратор полнотекстовых БД 2013.1 от 2014-03-12)
- irbis64.dll (дата изменения от 12.03.2014)
Список обновлённых файлов в БД:
- itext\itext.fst
Версия 2013.1 of 2014-04-22 (D1+)
Доработки АРМ Администратор и АРМ Читатель для полнотекстовых БД
Исправлены ошибки:
- В АРМ Администратор изменён алгоритм разбиения на страницы: запуск утилиты, извлекающей страницы, осуществляется до 3 раз при неудачном завершении. Тем самым удалось повысить стабильность работы АРМ Администратор, которая нарушалась за счёт зависания утилиты djvused.exe.
- В АРМ Администратор исправлена не критическая ошибка в алгоритме извлечения страниц. См. отчёт о данной ошибке 2014-04-14. Значительное замедление при добавлении файлов DJVU в случае большого количества страниц.
Доработки:
- В АРМ Администратор изменён алгоритм включения текстов в ПБД касательно файлов PDF и DJVU. Считается, что файл уже присутствует в ПБД, и не будет добавлен, если в ПБД присутствует ссылка на первую страницу соответствующего файла. Эта проверка осуществляется до разбиения файла на страницы. (До этого изменения алгоритм был следующим: 1) сначала осуществлялось разбиение на страницы; 2) затем происходила проверка наличия в ПБД каждой страницы.) Благодаря этому изменению снимается замечание 2014-04-14. Неоправданно длительное ожидание при попытке повторного добавления файла PDF или DJVU.
- В АРМ Администратор добавлена возможность вызова окна с информацией о версии программы (главное меню, пункт О программе...).
- В АРМ Читатель добавлена возможность вызова окна с информацией о версии программы (главное меню, пункт О программе...).
Список обновлённых файлов в дистрибутиве
- Irbis64_FullTextAdministrator.exe
- Irbis64_FullTextReader.exe
Версия 2013.1 of 2014-05-28 (D1+)
Исправлена ошибка в irbis64.dll.
Список обновлённых файлов в дистрибутиве
- irbis64.dll (дата изменения от 26.05.2014)
irbis64.dll
Дата изменения от 19.09.2013
Добавлены форматные выходы UNIFOR:
- +9L
- +9S
Дата изменения от 12.03.2014
Добавлены форматные выходы UNIFOR:
- +3C
Дата изменения от 20.03.2014
Дата изменения от 17.04.2014
Дата изменения от 26.05.2014
Исправлена ошибка, допущенная в версии от 17.04.2014.
Редактор ISO/MST файлов
Дата изменения от 11.04.2014
Доработки:
- При открытии файлов в формате ISO 2709 реализована возможность пропуска ошибок в формате файла и поиск целостных записей (как это реализовано для файлов MST).
- Вывод сведений о возникающих в процессе открытия редактором файлов в формате ISO 2709 ошибок в формате открываемого файла дополнен (в частности, позицией начала записи). Данная доработка облегчает анализ нарушений в формате файла.
- Реализован вывод в лог сообщений в процессе открытия редактором файлов в формате ISO 2709.
Исправление ошибок:
- Устранена ошибка, в результате которой было невозможно открытие редактором файлов, размер которых превышает 2 Гб.
Ссылки
См. также: