Полнотекстовые базы данных ИРБИС — различия между версиями
Sokv (обсуждение | вклад) |
Sokv (обсуждение | вклад) |
||
Строка 38: | Строка 38: | ||
* Документы, явно указанные пользователем. | * Документы, явно указанные пользователем. | ||
* Все документы из папки, указанной пользователем. | * Все документы из папки, указанной пользователем. | ||
+ | |||
+ | ===Будут ли ссылки на полнотекстовые документы относительными или абсолютными=== | ||
+ | |||
+ | В зависимости от выбранных опций могут использоваться относительные или абсолютные пути к файлам. | ||
===Будут ли полнотекстовые документы скопированы в специально предназначенный архив, или связь будет установлена с документами в их текущем местонахождении=== | ===Будут ли полнотекстовые документы скопированы в специально предназначенный архив, или связь будет установлена с документами в их текущем местонахождении=== | ||
Строка 44: | Строка 48: | ||
* Документы могут быть связаны с базой данных в их текущем местонахождении. | * Документы могут быть связаны с базой данных в их текущем местонахождении. | ||
* Документы могут быть скопированы в специально предназначенный архив – файл с расширением <tt>.izp</tt> в папке базы данных. | * Документы могут быть скопированы в специально предназначенный архив – файл с расширением <tt>.izp</tt> в папке базы данных. | ||
+ | |||
+ | ==Информация, вносимая в базу данных при включении полнотекстовых документов== | ||
+ | |||
+ | ===Ссылки на файлы полнотекстовых документов=== | ||
+ | |||
+ | Для ссылок на файлы полных текстов в полнотекстовой базе данных предлагается специальное поле (по умолчанию [[Использование в ИРБИС полей из блока локального использования формата RUSMARC|метка поля <tt>952</tt>]]). | ||
+ | |||
+ | Поле доступно на рабочем листе ''Технологическая''. | ||
+ | |||
+ | Для описания ссылки на полнотекстовый документ предлагаются подполя: | ||
+ | * <tt>А</tt> – имя файла полного текста в архиве базы данных; | ||
+ | * <tt>B</tt> – относительный или полный путь к файлу полного текста (относительный путь начинается с точки); | ||
+ | * <tt>C</tt> – полный путь к файлу zip/rar/pdf/djvu; | ||
+ | * <tt>I</tt> – URL текста, перенесённого из электронного каталога. | ||
+ | |||
+ | Примеры заполнения подполей: | ||
+ | |||
+ | ^AТехническая документация для WEB ИРБИС64 и WEB ИРБИС32.doc | ||
+ | |||
+ | ^B.\texts\irbis64_2008.doc | ||
+ | |||
+ | ^BD:\FullTexts\doc\ИРБИС_документация\ТЕХНИЧЕСКАЯ ДОКУМЕНТАЦИЯ.doc | ||
==Инструкция по включению полнотекстовых документов в базу данных ИРБИС с помощью АРМ Администратор== | ==Инструкция по включению полнотекстовых документов в базу данных ИРБИС с помощью АРМ Администратор== | ||
Строка 58: | Строка 84: | ||
Данная возможность предусмотрена для следующего случая: если в полнотекстовую базу данных нужно включить полнотекстовые документы, которые уже [[Связывание документов базы данных ИРБИС с внешними объектами|связаны с существующей базой данных ИРБИС через <tt>951</tt> поле]]. | Данная возможность предусмотрена для следующего случая: если в полнотекстовую базу данных нужно включить полнотекстовые документы, которые уже [[Связывание документов базы данных ИРБИС с внешними объектами|связаны с существующей базой данных ИРБИС через <tt>951</tt> поле]]. | ||
+ | |||
+ | ===Использование относительных путей в качестве ссылок на полнотекстовые документы=== | ||
+ | |||
+ | Относительные пути рекомендуется использовать в тех случаях, когда файлы полнотекстовых документов хранятся ''внутри'' папки соответствующей базы данных (непосредственно или в одной из вложенных папок). | ||
+ | |||
+ | '''Достоинства:''' | ||
+ | * тексты будут доступны при переносе базы данных; | ||
+ | * тексты будут доступны через Веб-ИРБИС. | ||
+ | |||
+ | ===Использование полных путей в качестве ссылок на полнотекстовые документы=== | ||
+ | |||
+ | Для обеспечения работоспособности ссылок в локальной сети рекомендуется использовать полные сетевые пути с указанием имени компьютера. | ||
+ | |||
+ | '''Недостатки:''' | ||
+ | * тексты не будут доступны через Веб-ИРБИС. | ||
+ | |||
+ | Если эти тексты имеют URL-адреса, то для обеспечения доступа к ним через Веб-ИРБИС можно использовать перенаправление (при котором происходит замена их сетевых адресов на URL). | ||
+ | |||
+ | Для этого в файле <tt>irbis_server.ini</tt>, который был создан при инсталляции в папке Веб-сервера для Веб-шлюза ИРБИС, в секции <tt>MAIN</tt> задать параметры (приведен пример значений параметров): | ||
+ | |||
+ | FullTextPathDbn=\\Alio1\irbiswrk\lusia\PDF_text\ | ||
+ | FullTextPathWeb=ftp:\\ftp.gpntb.ru\pub\irbis\ | ||
+ | |||
+ | В первом параметре следует указать сетевой путь на тексты, которые располагались по этому пути при их добавлении, в примере это - <tt>\\Alio1\irbiswrk\lusia\PDF_text\</tt>. Во втором параметре следует указать часть URL текстов (до их названия) их расположения. В примере это - <tt>ftp:\\ftp.gpntb.ru\pub\irbis\</tt>. | ||
+ | |||
+ | В формате <tt>BRIEFHTML_ft.pft</tt> имеется вставка (если нет, добавить), которая замещает в адресе текста (в подполе <tt>952^B</tt>) путь на файл при создании на URL местоположения текста. Часть формата: | ||
+ | |||
+ | /* возможность замены формата через параметры irbis_server.ini из cgi | ||
+ | if &uf('IMAIN,FullTextPathDbn,')<>'' and &uf('IMAIN,FullTextPathWeb,')<>'' | ||
+ | then | ||
+ | &uf('+7W10#',&uf('+9I?',,&uf('IMAIN,FullTextPathDbn,'),,'?#',,&uf('IMAIN,FullTextPathWeb,'),,'#',v952^B)), | ||
+ | '<a style="border:0px;font-size:12px;" target=_blank href="',G10, | ||
+ | else | ||
+ | /* | ||
+ | |||
+ | Здесь использован форматный выход <tt>&uf('+9I?исходная строка?#выходная строка#строка где замена)</tt>. Ограничители <tt>?</tt> и <tt>#</tt> могут быть любыми символами с кодом меньше <tt>128</tt>. | ||
===Включение полнотекстовых документов с копированием в специально предназначенный архив=== | ===Включение полнотекстовых документов с копированием в специально предназначенный архив=== | ||
Строка 75: | Строка 137: | ||
Выбор одного из вариантов осуществляется с помощью флажка ''Добавить директорию с текстами''. | Выбор одного из вариантов осуществляется с помощью флажка ''Добавить директорию с текстами''. | ||
+ | |||
+ | ===Полнотекстовые базы в Веб-ИРБИС=== | ||
+ | |||
+ | Если в полнотекстовом документе в формате HTML имеются ссылки на изображения или другие страницы, то они должны быть указаны в форме URL. | ||
==Ссылки== | ==Ссылки== |
Версия 19:31, 24 февраля 2010
В версии АРМ Администратор полнотекстовых БД присутствует функциональная возможность включения полнотекстовых документов в базу данных ИРБИС.
Идея включения полнотекстовых документов в базу данных ИРБИС – предоставить пользователю возможность осуществлять полнотекстовый поиск и просмотр найденных документов.
Содержание
- 1 Особенности включения полнотекстовых документов в базу данных ИРБИС
- 2 Отличие возможности включения полнотекстовых документов в базу данных от возможности связывания документов базы данных с внешними объектами
- 3 Возможные варианты включения полнотекстовых документов в базу данных ИРБИС
- 3.1 Будут ли полнотекстовые документы явно указаны пользователем, или ссылки на полнотекстовые документы будут взяты из существующей базы данных
- 3.2 Будут ли включены указанные пользователем документы или все документы из указанной пользователем папки
- 3.3 Будут ли ссылки на полнотекстовые документы относительными или абсолютными
- 3.4 Будут ли полнотекстовые документы скопированы в специально предназначенный архив, или связь будет установлена с документами в их текущем местонахождении
- 4 Информация, вносимая в базу данных при включении полнотекстовых документов
- 5 Инструкция по включению полнотекстовых документов в базу данных ИРБИС с помощью АРМ Администратор
- 5.1 Включение в полнотекстовую базу полнотекстовых документов, на которые имеются ссылки в 951 поле другой базы данных ИРБИС
- 5.2 Использование относительных путей в качестве ссылок на полнотекстовые документы
- 5.3 Использование полных путей в качестве ссылок на полнотекстовые документы
- 5.4 Включение полнотекстовых документов с копированием в специально предназначенный архив
- 5.5 Включение указанных пользователем документов или всех документов из указанной пользователем папки
- 5.6 Полнотекстовые базы в Веб-ИРБИС
- 6 Ссылки
Особенности включения полнотекстовых документов в базу данных ИРБИС
В полнотекстовые базы данных ИРБИС могут быть включены полнотекстовые документы в форматах HTML, DOC, PDF и DJVU.
При включении полнотекстовых документов в базу данных ИРБИС:
- в соответствие каждому добавленному полнотекстовому документу в базе создаётся запись;
- в словарь попадают термины из добавленных полнотекстовых документов;
- в полнотекстовой базе данных хранятся пути (полные или относительные) к добавленным полнотекстовым документам; сами полнотекстовые документы остаются в виде файлов на файловой системе или попадают в архивный файл (в зависимости от выбранного режима при добавлении).
Следует иметь в виду, что в словарь попадут только те термины, которые присутствуют в полнотекстовых документах в текстовом виде (не в виде графического изображения).
Отличие возможности включения полнотекстовых документов в базу данных от возможности связывания документов базы данных с внешними объектами
Не следует путать возможность включения полнотекстовых документов с возможностью связывания документов базы данных с внешними объектами.
Сходства возможностей:
- Обе эти возможности позволяют установить связь документов базы данных с внешними объектами.
Различия возможностей:
- Возможность связывания документов базы данных с внешними объектами ограничивается обеспечением простоты перехода пользователя от документа базы данных к внешнему объекту.
- Возможность включения полнотекстовых документов в базу данных обеспечивает полнотекстовый поиск, а также переход пользователя к найденным внешним объектам.
Возможные варианты включения полнотекстовых документов в базу данных ИРБИС
Будут ли полнотекстовые документы явно указаны пользователем, или ссылки на полнотекстовые документы будут взяты из существующей базы данных
В зависимости от выбранных опций, в текущую базу данных могут быть включены:
- полнотекстовые документы, местонахождение которых на файловой системе непосредственно указывает пользователь;
- полнотекстовые документы, на которые имеются ссылки в 951 поле существующей базы данных ИРБИС, которую указывает пользователь (см. раздел данной статьи #Включение в полнотекстовую базу полнотекстовых документов, на которые имеются ссылки в 951 поле другой базы данных ИРБИС).
Будут ли включены указанные пользователем документы или все документы из указанной пользователем папки
В зависимости от выбранных опций, в текущую базу данных могут быть включены:
- Документы, явно указанные пользователем.
- Все документы из папки, указанной пользователем.
Будут ли ссылки на полнотекстовые документы относительными или абсолютными
В зависимости от выбранных опций могут использоваться относительные или абсолютные пути к файлам.
Будут ли полнотекстовые документы скопированы в специально предназначенный архив, или связь будет установлена с документами в их текущем местонахождении
В зависимости от выбранных опций, при включении полнотекстовых документов в базу данных:
- Документы могут быть связаны с базой данных в их текущем местонахождении.
- Документы могут быть скопированы в специально предназначенный архив – файл с расширением .izp в папке базы данных.
Информация, вносимая в базу данных при включении полнотекстовых документов
Ссылки на файлы полнотекстовых документов
Для ссылок на файлы полных текстов в полнотекстовой базе данных предлагается специальное поле (по умолчанию метка поля 952).
Поле доступно на рабочем листе Технологическая.
Для описания ссылки на полнотекстовый документ предлагаются подполя:
- А – имя файла полного текста в архиве базы данных;
- B – относительный или полный путь к файлу полного текста (относительный путь начинается с точки);
- C – полный путь к файлу zip/rar/pdf/djvu;
- I – URL текста, перенесённого из электронного каталога.
Примеры заполнения подполей:
^AТехническая документация для WEB ИРБИС64 и WEB ИРБИС32.doc
^B.\texts\irbis64_2008.doc
^BD:\FullTexts\doc\ИРБИС_документация\ТЕХНИЧЕСКАЯ ДОКУМЕНТАЦИЯ.doc
Инструкция по включению полнотекстовых документов в базу данных ИРБИС с помощью АРМ Администратор
Включение полнотекстовых документов в базу данных ИРБИС осуществляется с помощью специального диалогового окна, которое открывается при вызове пункта главного меню Полнотекстовый сервис – Добавить (удалить) тексты в БД.
Собственно включение полнотекстовых документов в базу данных ИРБИС происходит после нажатия кнопки Добавить.
Существует ряд настроек, касающихся особенностей включения полнотекстовых документов в базу данных ИРБИС, которым посвящены следующие подразделы.
Включение в полнотекстовую базу полнотекстовых документов, на которые имеются ссылки в 951 поле другой базы данных ИРБИС
Возможность осуществляется с помощью кнопки Добавить тексты из ЭК.
Данная возможность предусмотрена для следующего случая: если в полнотекстовую базу данных нужно включить полнотекстовые документы, которые уже связаны с существующей базой данных ИРБИС через 951 поле.
Использование относительных путей в качестве ссылок на полнотекстовые документы
Относительные пути рекомендуется использовать в тех случаях, когда файлы полнотекстовых документов хранятся внутри папки соответствующей базы данных (непосредственно или в одной из вложенных папок).
Достоинства:
- тексты будут доступны при переносе базы данных;
- тексты будут доступны через Веб-ИРБИС.
Использование полных путей в качестве ссылок на полнотекстовые документы
Для обеспечения работоспособности ссылок в локальной сети рекомендуется использовать полные сетевые пути с указанием имени компьютера.
Недостатки:
- тексты не будут доступны через Веб-ИРБИС.
Если эти тексты имеют URL-адреса, то для обеспечения доступа к ним через Веб-ИРБИС можно использовать перенаправление (при котором происходит замена их сетевых адресов на URL).
Для этого в файле irbis_server.ini, который был создан при инсталляции в папке Веб-сервера для Веб-шлюза ИРБИС, в секции MAIN задать параметры (приведен пример значений параметров):
FullTextPathDbn=\\Alio1\irbiswrk\lusia\PDF_text\ FullTextPathWeb=ftp:\\ftp.gpntb.ru\pub\irbis\
В первом параметре следует указать сетевой путь на тексты, которые располагались по этому пути при их добавлении, в примере это - \\Alio1\irbiswrk\lusia\PDF_text\. Во втором параметре следует указать часть URL текстов (до их названия) их расположения. В примере это - ftp:\\ftp.gpntb.ru\pub\irbis\.
В формате BRIEFHTML_ft.pft имеется вставка (если нет, добавить), которая замещает в адресе текста (в подполе 952^B) путь на файл при создании на URL местоположения текста. Часть формата:
/* возможность замены формата через параметры irbis_server.ini из cgi if &uf('IMAIN,FullTextPathDbn,')<> and &uf('IMAIN,FullTextPathWeb,')<> then &uf('+7W10#',&uf('+9I?',,&uf('IMAIN,FullTextPathDbn,'),,'?#',,&uf('IMAIN,FullTextPathWeb,'),,'#',v952^B)), '<a style="border:0px;font-size:12px;" target=_blank href="',G10, else /*
Здесь использован форматный выход &uf('+9I?исходная строка?#выходная строка#строка где замена). Ограничители ? и # могут быть любыми символами с кодом меньше 128.
Включение полнотекстовых документов с копированием в специально предназначенный архив
Опции включения полнотекстовых документов, совместимые с данной:
- Возможно включение как указанных пользователем документов, так и всех документов из указанной папки.
Достоинства:
- Компактное хранение полнотекстовых документов (это относится к документам, хорошо поддающимся сжатию при архивации).
- При перемещении папки с базой данных не требуется изменений в ссылках на файлы, поскольку ссылки являются относительными (только имя документа в архиве).
Недостатки:
- Дополнительные затраты времени на разархивирование при обеспечении доступа к полнотекстовому документу.
- Тексты не доступны через Веб-ИРБИС.
Включение указанных пользователем документов или всех документов из указанной пользователем папки
Выбор одного из вариантов осуществляется с помощью флажка Добавить директорию с текстами.
Полнотекстовые базы в Веб-ИРБИС
Если в полнотекстовом документе в формате HTML имеются ссылки на изображения или другие страницы, то они должны быть указаны в форме URL.
Ссылки
См. также: