Список изменений ИРБИС версии 2013.1
Содержание
Продукты ИРБИС для работы с полнотекстовыми базами данных
Доработки
- В АРМ Читатель доработана функция полнотекстового поиска – реализована возможность поиска с учётом морфологии слов (в качестве альтернативы усечению слов). Включение/выключение данной возможности осуществляется в окне настроек при помощи опции Поиск с морфологическим разбором слов. Данная опция сохраняется в конфигурационном файле АРМ Читатель для полнотекстовых БД в параметре FullTextMorphology.
- В АРМ Читатель реализована возможность выдачи результатов поиска с группировкой найденных страниц по исходному документу. Для включения/выключения данной возможности в конфигурационном файле АРМ Читатель для полнотекстовых БД введён параметр USE_TAGS_IN_SEARCH. Дополнительно введены параметры: Field_NUM_PAGES и Field_NUM_MFNS.
- В АРМ Администратор доработан механизм создания словаря: появилась возможность распараллеливания, отбор может осуществляться параллельно несколькими процессами. Для указания количества процессов при создании словаря в конфигурационном файле АРМ Администратор ИРБИС введён параметр MULTILOAD.
- В АРМ Администратор доработан механизм индексирования по методу 9 – реализована возможность получения ссылки (пути) на индексируемый файл исключительно посредством ТВП (без непосредственного обращения к БД). Также оставлена возможность получения ссылки способом, реализованным в предыдущих версиях ИРБИС. Для включения/выключения данной возможности предназначен параметр method9_tryNotUseDirectDBAccess (описание параметра см. в статье Конфигурационные параметры ИРБИС для полнотекстовых БД).
Примечание: Данная доработка также реализована в последних обновлениях версий 2012.1 и 2011.1.
- В АРМ Администратор изменён механизм включения текстов из электронного каталога. Отменена возможность включения файлов PDF и DJVU без разбиения на страницы. Многостраничные файлы PDF и DJVU включаются только в полнотекстовую базу данных с разбиением на страницы. Описание Dublin Core создаётся на основе библиографического описания, и прикрепляется к записи полнотекстовой БД, соответствующей первой странице документа. Другие страницы связываются с описанием Dublin Core посредством записи словаря (инвертированного файла); для установления связи используется подполе 952^b.
- В АРМ Читатель постраничный просмотр PDF файлов реализован на основе HTML-страницы, выступающей в роли шаблона. Для указания шаблона в конфигурационном файле АРМ Читатель для полнотекстовых БД добавлен параметр jpgViewerFilename. Комментарий: на основе данного шаблона реализована возможность изменения масштаба в окне постраничного просмотра PDF файлов (см. описание ниже).
- В АРМ Читатель в окне постраничного просмотра PDF файлов добавлена возможность изменения масштаба просматриваемой страницы.
Изменение порядка включения текстов в полнотекстовую БД
Новые возможности версии 2013.1
- Концепция местоположения внешних ресурсов (текстов) позволяет использовать относительные ссылки на одни и те же тексты в разных БД (например, в БД ЭК и полнотекстовой). Достаточно в 11 строке соответствующих .par файлов указать одинаковое местоположение внешних ресурсов.
- При использовании относительных ссылок местоположение текстов на файловой системе может быть легко изменено, при этом достаточно поменять путь в 11 строке .par файла(ов).
Ограничения, вводимые с версии 2013.1
Запрещено указание путей, начинающихся с буквы диска. Следует указывать пути UNC (например: \\ComputerName\SharedFolder\Resource.pdf).
По умолчанию, при включении текстов по абсолютным путям, разрешено указывать только ЛОКАЛЬНЫЕ пути UNC (запрещено включать тексты с других компьютеров в локальной сети). Для включения/выключения данного ограничения в конфигурационном файле АРМ Администратор ИРБИС введён параметр onlyLocalUncPath.
Рекомендации по включению текстов в полнотекстовую БД
Размещать внешние ресурсы (тексты) следует локально (на том же компьютере, где установлен ИРБИС для полнотекстовых БД).
При включении текстов в полнотекстовую БД предпочтительно использование относительных путей.
Рекомендуется выбрать одно местоположение внешних ресурсов (текстов), указать его В 11 строке .par файла, и при включении текстов в полнотекстовую базу использовать относительные пути.
В 11 строке .par файла в качестве пути рекомендуется использовать:
- относительный путь, начинающийся с точки или
- UNC-путь к файлу (например: \\ComputerName\SharedFolder\Resource.pdf)
Только при невозможности размещения внешних ресурсов (текстов) внутри одной папки при включении текстов в полнотекстовую БД следует использовать абсолютные пути.
Другие изменения
- По умолчанию включено построение тематического словаря. В конфигурационном файле irbisa_fulltext.ini в исходной конфигурации убран параметр isSboychakovThemeDictionaryEnable.
Список обновлённых файлов в дистрибутиве
- Irbis64_FullTextAdministrator.exe
- Irbis64_FullTextReader.exe
- irbis64.dll с форматным выходом +9S
- ТВП для инвертированного файла полнотекстовой БД
- extra_unifor.dll
- sr.js, search_header.pft, BriefHTML_web_brief.pft, BriefHTML_mfn.pft, search_empty.pft, BriefHTML_web_nearmfn.pft, bottom_string.pft
- jpgViewer.html
Список изменений в конфигурационных файлах
irbisa_fulltext.ini
[main] # isSboychakovThemeDictionaryEnable - убран из исходной конфигурации MULTILOAD=1
irbisr_fulltext.ini
[main] # Включение/выключение возможности поиска с учётом морфологии слов (сохраняет значение опции Поиск с морфологическим разбором слов). FullTextMorphology=1 # Включение/выключение возможности выдачи результатов поиска с группировкой найденных страниц по исходному документу. USE_TAGS_IN_SEARCH=0 # Имя шаблона HTML-страницы, используемой для показа страницы PDF-документа. jpgViewerFilename=.\jpgViewer.html [VirtualFields] Field_NUM_PAGES=3500 Field_NUM_MFNS=3501
irbis64.dll
- Добавлен UNIFOR +9S.
Ссылки
См. также: