АРМ Администратор полнотекстовых БД — различия между версиями
Sokv (обсуждение | вклад) |
Sokv (обсуждение | вклад) |
||
Строка 10: | Строка 10: | ||
==Включение полнотекстовых документов в базу данных ИРБИС== | ==Включение полнотекстовых документов в базу данных ИРБИС== | ||
+ | |||
+ | При включении текстов в базу данных добавляются соответствующие записи, содержащие [[Полнотекстовые базы данных ИРБИС#Ссылки на файлы полнотекстовых документов|ссылки на файлы с полными текстами]]. Включение текстов в базу и удаление текстов из базы влекут изменения базы данных, при этом сами файлы полных текстов остаются в неизменном виде на файловой системе. | ||
Включение полнотекстовых документов в базу данных ИРБИС осуществляется с помощью специальной формы, которая открывается при выборе пункта главного меню ''Полнотекстовый сервис – Добавить / удалить полнотекстовые документы'' (<small>для версии 2009.1 ''Полнотекстовый сервис – Добавить (удалить) тексты в БД''</small>). | Включение полнотекстовых документов в базу данных ИРБИС осуществляется с помощью специальной формы, которая открывается при выборе пункта главного меню ''Полнотекстовый сервис – Добавить / удалить полнотекстовые документы'' (<small>для версии 2009.1 ''Полнотекстовый сервис – Добавить (удалить) тексты в БД''</small>). | ||
Строка 47: | Строка 49: | ||
Разбиение файлов на страницы выполняется при добавлении текстов в базу, если выставлена соответствующая опция, а также при создании словаря (для текстов, являющихся страницами многостраничного PDF-файла). | Разбиение файлов на страницы выполняется при добавлении текстов в базу, если выставлена соответствующая опция, а также при создании словаря (для текстов, являющихся страницами многостраничного PDF-файла). | ||
+ | |||
+ | ===Ассоциация текстовых файлов с включаемыми в полнотекстовую базу документами=== | ||
+ | |||
+ | '''''Примечание: данная возможность [[Отличия ИРБИС 2011.1 от предыдущей версии#Доработки|поддерживается с версии 2011.1]].''''' | ||
+ | |||
+ | Существует возможность включения в полнотекстовую базу документов с ассоциированным текстовым файлом. В этом случае для отображения пользователю будет использован сам включённый в базу документ, а [[#Обслуживание словаря полнотекстовых баз данных ИРБИС|словарь будет построен на основе ассоциированного текстового файла]]. | ||
===Возможность размещения полнотекстовых документов в специально предназначенном архиве (не поддерживается с версии 2010.1)=== | ===Возможность размещения полнотекстовых документов в специально предназначенном архиве (не поддерживается с версии 2010.1)=== | ||
Строка 54: | Строка 62: | ||
В зависимости от выбранных опций, при включении полнотекстовых документов в базу данных | В зависимости от выбранных опций, при включении полнотекстовых документов в базу данных | ||
документы могут быть скопированы в специально предназначенный архив – файл с расширением <tt>.izp</tt> в папке базы данных. | документы могут быть скопированы в специально предназначенный архив – файл с расширением <tt>.izp</tt> в папке базы данных. | ||
+ | |||
+ | ==Обслуживание словаря полнотекстовых баз данных ИРБИС== | ||
+ | |||
+ | При актуализации или создании словаря по [[Полнотекстовые базы данных ИРБИС#Ссылки на файлы полнотекстовых документов|ссылкам на полнотекстовые документы]], которые были добавлены при включении текстов в базу, находятся соответствующие файлы. Из этих файлов извлекаются текстовые данные, на основе которых строится словарь базы данных. | ||
+ | |||
+ | В словарь попадают только те термины, которые присутствуют в полнотекстовых документах в текстовом виде (не в виде графического изображения). Если есть ассоциированный текстовый файл, то в словарь попадают только те термины, которые присутствуют в ассоциированном текстовом файле. | ||
==Ссылки== | ==Ссылки== |
Версия 08:50, 27 декабря 2010
Для создания электронных коллекций полнотекстовых документов с возможностью полнотекстового поиска в АРМ Администриратор полнотекстовых БД поддерживается работа с полнотекстовыми базами данных ИРБИС.
В этой статье описаны возможности АРМ Администриратор полнотекстовых БД, характерные для работы с полнотекстовыми базами. Общие возможности АРМ Администратор, относящихся к любым базам, описаны в статье АРМ Администратор.
Рекомендации по созданию полнотекстовых баз данных ИРБИС можно найти в статье Включение полнотекстовых документов в базу данных ИРБИС.
Содержание
- 1 Создание новой полнотекстовой базы данных
- 2 Включение полнотекстовых документов в базу данных ИРБИС
- 2.1 Возможности выбора полнотекстовых документов, которые необходимо включить в базу данных ИРБИС
- 2.2 Виды ссылок на полнотекстовые документы (относительные или абсолютные)
- 2.3 Возможность включения в базу полнотекстовых документов с разбиением на страницы
- 2.4 Ассоциация текстовых файлов с включаемыми в полнотекстовую базу документами
- 2.5 Возможность размещения полнотекстовых документов в специально предназначенном архиве (не поддерживается с версии 2010.1)
- 3 Обслуживание словаря полнотекстовых баз данных ИРБИС
- 4 Ссылки
Создание новой полнотекстовой базы данных
Необходимые действия для создания баз данных, в том числе полнотекстовых, описаны в соответствующем разделе статьи АРМ Администратор.
Включение полнотекстовых документов в базу данных ИРБИС
При включении текстов в базу данных добавляются соответствующие записи, содержащие ссылки на файлы с полными текстами. Включение текстов в базу и удаление текстов из базы влекут изменения базы данных, при этом сами файлы полных текстов остаются в неизменном виде на файловой системе.
Включение полнотекстовых документов в базу данных ИРБИС осуществляется с помощью специальной формы, которая открывается при выборе пункта главного меню Полнотекстовый сервис – Добавить / удалить полнотекстовые документы (для версии 2009.1 Полнотекстовый сервис – Добавить (удалить) тексты в БД).
Графический интерфейс этой формы представляет собой:
- набор вкладок и опций, относящихся к процессу включения текстов в базу данных ИРБИС;
- список включённых в полнотекстовую базу данных текстов;
- кнопки Добавить, Удалить, Обновить.
Процесс включения текстов начинается по нажатию кнопки Добавить и осуществляется в соответствии с выбранными опциями.
При нажатии кнопки Удалить происходит удаление из базы данных выбранных текстов.
Ниже описаны опции, относящиеся к процессу включения текстов в базу данных ИРБИС.
Возможности выбора полнотекстовых документов, которые необходимо включить в базу данных ИРБИС
В зависимости от выбранной вкладки изменяется способ указания текстов, которые необходимо включить в полнотекстовую базу. Примечание: в версии 2009.1 таких вкладок нет.
В текущую базу данных могут быть включены:
- Документы, явно указанные пользователем (вкладка Отдельные файлы, в версии 2009.1 снятый флажок Добавить директорию с текстами). После нажатия кнопки Добавить осуществляется выбор отдельных файлов.
- Все документы из папки, указанной пользователем (вкладка Папки, в версии 2009.1 установленный флажок Добавить директорию с текстами). После нажатия кнопки Добавить осуществляется выбор папки.
- Все документы из архива ZIP или RAR, указанного пользователем (вкладка Архивы). После нажатия кнопки Добавить осуществляется выбор архивов.
- полнотекстовые документы, связанные с базой данных электронного каталога ИРБИС в качестве внешних объектов (вкладка Внешние объекты электронного каталога, в версии 2009.1 кнопка Добавить тексты из ЭК). После нажатия кнопки Добавить осуществляется выбор электронного каталога.
Виды ссылок на полнотекстовые документы (относительные или абсолютные)
В зависимости от выбранных опций в базе данных ИРБИС могут быть сохранены относительные или абсолютные пути к файлам полных текстов.
Использование относительных путей возможно в случае хранения полных текстов в папке базы данных.
Возможность включения в базу полнотекстовых документов с разбиением на страницы
PDF-файлы и DJVU-файлы могут быть включены в полнотекстовую базу данных с разбиением на страницы.
При включении в базу с разбиением на страницы каждая страница добавляется в базу как отдельный документ. В этом случае при полнотекстовом поиске пользователь может найти отдельную страницу документа, а не многостраничный документ целиком.
Разбиение файлов на страницы выполняется при добавлении текстов в базу, если выставлена соответствующая опция, а также при создании словаря (для текстов, являющихся страницами многостраничного PDF-файла).
Ассоциация текстовых файлов с включаемыми в полнотекстовую базу документами
Примечание: данная возможность поддерживается с версии 2011.1.
Существует возможность включения в полнотекстовую базу документов с ассоциированным текстовым файлом. В этом случае для отображения пользователю будет использован сам включённый в базу документ, а словарь будет построен на основе ассоциированного текстового файла.
Возможность размещения полнотекстовых документов в специально предназначенном архиве (не поддерживается с версии 2010.1)
Примечание: начиная с версии 2010.1 данная возможность не поддерживается, в связи с чем не рекомендуется к использованию.
В зависимости от выбранных опций, при включении полнотекстовых документов в базу данных документы могут быть скопированы в специально предназначенный архив – файл с расширением .izp в папке базы данных.
Обслуживание словаря полнотекстовых баз данных ИРБИС
При актуализации или создании словаря по ссылкам на полнотекстовые документы, которые были добавлены при включении текстов в базу, находятся соответствующие файлы. Из этих файлов извлекаются текстовые данные, на основе которых строится словарь базы данных.
В словарь попадают только те термины, которые присутствуют в полнотекстовых документах в текстовом виде (не в виде графического изображения). Если есть ассоциированный текстовый файл, то в словарь попадают только те термины, которые присутствуют в ассоциированном текстовом файле.
Ссылки
См. также: