АРМ Администратор полнотекстовых БД — различия между версиями

Материал из Wikipedia
Перейти к: навигация, поиск
Строка 33: Строка 33:
 
В зависимости от выбранных опций, при включении полнотекстовых документов в базу данных
 
В зависимости от выбранных опций, при включении полнотекстовых документов в базу данных
 
документы могут быть скопированы в специально предназначенный архив – файл с расширением <tt>.izp</tt> в папке базы данных.
 
документы могут быть скопированы в специально предназначенный архив – файл с расширением <tt>.izp</tt> в папке базы данных.
 +
 +
===Возможность включения в базу полнотекстовых документов с разбиением на страницы===
 +
 +
PDF-файлы и DJVU-файлы могут быть включены в полнотекстовую базу данных с разбиением на страницы.
 +
 +
При включении в базу с разбиением на страницы каждая страница добавляется в базу как отдельный документ. В этом случае при полнотекстовом поиске пользователь может найти отдельную страницу документа, а не многостраничный документ целиком.
 +
 +
Разбиение файлов на страницы выполняется при добавлении текстов в базу, если выставлена соответствующая опция, а также при создании словаря (для текстов, являющихся страницами многостраничного PDF-файла).
 +
 +
===Особенности включения PDF-файлов в полнотекстовую базу===
 +
 +
====Требования к PDF-файлам для ИРБИС 2010.1====
 +
 +
Возможно включение PDF-файлов (как с разбиением на страницы, так и [[Включение полнотекстовых документов в базу данных ИРБИС#Извлечение текста из PDF-файлов в процессе создания словаря|без разбиения]]) до версии 1.6 включительно.
 +
 +
====Требования к PDF-файлам для ИРБИС 2008.1 и 2009.1====
 +
 +
Возможно включение PDF-файлов:
 +
* с разбиением на страницы до версии 1.6 включительно,
 +
* [[Включение полнотекстовых документов в базу данных ИРБИС#Извлечение текста из PDF-файлов в процессе создания словаря|без разбиения на страницы до версии 1.4 включительно]].
 +
  
 
==Ссылки==
 
==Ссылки==

Версия 01:55, 3 декабря 2010

Для создания электронных коллекций полнотекстовых документов с возможностью полнотекстового поиска в АРМ Администриратор полнотекстовых БД поддерживается работа с полнотекстовыми базами данных ИРБИС.

В этой статье описаны возможности АРМ Администриратор полнотекстовых БД, характерные для работы с полнотекстовыми базами. Общие возможности АРМ Администратор, относящихся к любым базам, описаны в статье АРМ Администратор.

Рекомендации по созданию полнотекстовых баз данных ИРБИС можно найти в статье Включение полнотекстовых документов в базу данных ИРБИС.

Создание новой полнотекстовой базы данных

Необходимые действия для создания баз данных, в том числе полнотекстовых, описаны в соответствующем разделе статьи АРМ Администратор.

Включение полнотекстовых документов в базу данных ИРБИС

Включение полнотекстовых документов в базу данных ИРБИС осуществляется с помощью специальной формы, которая открывается при выборе пункта главного меню Полнотекстовый сервис – Добавить (удалить) тексты в БД.

Возможности выбора полнотекстовых документов, которые необходимо включить в базу данных ИРБИС

В зависимости от выбранных опций, в текущую базу данных могут быть включены:

Виды ссылок на полнотекстовые документы (относительные или абсолютные)

В зависимости от выбранных опций в базе данных ИРБИС могут быть сохранены относительные или абсолютные пути к файлам полных текстов.

Использование относительных путей возможно в случае хранения полных текстов в папке базы данных.

Возможность размещения полнотекстовых документов в специально предназначенном архиве

Примечание: начиная с версии 2010.1 планируется отказ от поддержки данной возможности в связи с недостатками. В связи с чем не рекомендуется использовать эту возможность.

В зависимости от выбранных опций, при включении полнотекстовых документов в базу данных документы могут быть скопированы в специально предназначенный архив – файл с расширением .izp в папке базы данных.

Возможность включения в базу полнотекстовых документов с разбиением на страницы

PDF-файлы и DJVU-файлы могут быть включены в полнотекстовую базу данных с разбиением на страницы.

При включении в базу с разбиением на страницы каждая страница добавляется в базу как отдельный документ. В этом случае при полнотекстовом поиске пользователь может найти отдельную страницу документа, а не многостраничный документ целиком.

Разбиение файлов на страницы выполняется при добавлении текстов в базу, если выставлена соответствующая опция, а также при создании словаря (для текстов, являющихся страницами многостраничного PDF-файла).

Особенности включения PDF-файлов в полнотекстовую базу

Требования к PDF-файлам для ИРБИС 2010.1

Возможно включение PDF-файлов (как с разбиением на страницы, так и без разбиения) до версии 1.6 включительно.

Требования к PDF-файлам для ИРБИС 2008.1 и 2009.1

Возможно включение PDF-файлов:


Ссылки

См. также: