Механизм полнотекстового поиска — различия между версиями
Sokv (обсуждение | вклад) (Новая страница: «'''''Механизм полнотекстового поиска''''' в ИРБИС обеспечивает быстрый поиск по текстовым фа…») |
(нет различий)
|
Текущая версия на 01:30, 17 февраля 2016
Механизм полнотекстового поиска в ИРБИС обеспечивает быстрый поиск по текстовым файлам, связанным с записями базы данных при помощи ссылки. Механизм основан на расширении концепций индекса базы данных ИРБИС и ТВП, служащей для определения индекса базы данных.
Метод индексирования 9
Метод индексирования 9 был разработан в качестве расширения концепции ТВП. Реализован в рамках технологии полнотекстовых баз данных ИРБИС, и работает только для функций создания и актуализации словаря.
Создаёт элемент в соответствии со следующими правилами:
- Создаёт элемент из каждого слова текста. Подробнее о выборе слов из текста см. подраздел Алгоритм выбора слов статьи Таблица выбора полей.
- Текст берёт из внешнего файла в соответствии со ссылкой.
- Ссылку получает из строки, созданной форматом.
Подробнее о ссылках и получении текста см. в подразделе Ссылки на полные тексты статьи Схема полнотекстовой базы данных и подразделе Механизм доступа к объектам полнотекстового поиска статьи Полнотекстовые базы данных ИРБИС.
В процессе метода индексирования 9 задействовано несколько видов кеширования:
- Кеширование на файловой системе страниц многостраничного документа. Примечание: начиная с версии 2012.1.
- Кеширование текста непосредственно в записях базы данных. Примечание: начиная с версии 2014.1.
В процессе метода индексирования 9 в записи базы данных может осуществляться запись некоторых технологических данных.
Эти технологические данные пишутся при выполнении хотя бы одного из условий (начиная с версии 2014.1):
- В записи базы данных отсутствует кешированный текст.
- Включён параметр alwaysRefreshTextRecord.
Для обеспечения возможности поиска текстов (страниц), в которых отсутствует текст, реализован механизм, который фиксирует данный факт в словаре: если перед завершением метода индексирования 9 отсутствуют элементы, которые он должен вернуть, то метод возвращает элемент NO_TEXT_AT_PAGE. Примечание: начиная с версии 2014.1.
Ссылки
См. также: