Таблица выбора полей — различия между версиями
Sokv (обсуждение | вклад) (Новая страница: «Таблица выбора полей (ТВП) определяет критерий выбора одного или более элементов из запис…») |
Sokv (обсуждение | вклад) м (переименовал «ТВП» в «Таблица выбора полей») |
(нет различий)
|
Версия 16:49, 17 августа 2011
Таблица выбора полей (ТВП) определяет критерий выбора одного или более элементов из записей базы данных. В зависимости от конкретного ис-пользования ТВП создаваемые элементы могут затем использоваться либо для создания терминов инвертированного файла (словаря), либо для переформа-тирования записей во время операций импорта/экспорта или копирования. Таблица выбора полей как отдельная структура сохраняется в текстовом файле с расширением FST. (Примеры ТВП см. в директориях БД системы ИР-БИС.) ТВП состоит из набора строк, каждая из которых содержит следующие три параметра, разделенные знаком пробел: идентификатор поля (ИП); метод индексирования (МИ); формат выборки данных, представленный на языке форматирования системы (см. Приложение 4). Когда появляется необходимость в выборке элементов с использованием ТВП, система производит чтение требуемых записей (документов) файла доку-ментов и выполняет следующие действия по каждой записи и каждой строке ТВП: 1 - отрабатывает формат выборки применительно к текущему документу; 2 - к данным, извлеченным форматом, применяет указанный метод ин-дексирования (об этом см. ниже); 3 - присваивает каждому созданному таким образом элементу соответст-вующий идентификатор поля. Этот процесс является чисто механическим и подразумевает только то, что описано в этих трех пунктах. Шаги связаны только лишь данными, которые создаются при их выполнении. Например, тот факт, что на шаге 1 произошла выборка данных из конкретного поля, является несущественным на шаге 2. На шаге 1 могут использоваться все возможности языка форматирования для соз-дания строки символов, которая затем поступает в распоряжение шага 2. На шаге 2 поступившие строки символов обрабатываются в соответствии с указан-ным методом индексирования. Методы индексирования представляют собой некоторый процесс, определяемый на строках символов, а не на записях или полях. Именно благодаря такому универсальному пониманию сути ТВП, пре-доставляется возможность использовать их для таких, на первый взгляд со-вершенно независимых целей, как определение содержимого инвертированно-го файла и способ преобразования данных при импорте документов. В самом общем смысле ТВП может восприниматься как некоторый меха-низм порождения элементов данных на основе имеющихся в документе с це-лью последующего выполнения некоторой определенной задачи.