Язык форматирования системы ИРБИС

Материал из Wikipedia
Перейти к: навигация, поиск

Язык форматирования ИРБИС (язык манипулирования данными) представляет собой средство, с помощью которого осуществляется разнообразное представление данных для многих операций и режимов системы, в частности, для показа и печати документов, для создания словарей, для импорта/экспорта данных, для формально-логического контроля и т.д.

Общие сведения

История появления

Язык форматирования системы ИРБИС базируется на языке форматирования системы CDS/ISIS (ЮНЕСКО).

Понятие формата

Совокупность команд и функций, записанных в соответствии с требованиями языка форматирования, называется форматом. В общем случае формат определяет некоторое подмножество данных из записи базы данных, которые затем могут использоваться системой для выполнения определенных функций.

Формат как отдельная структура сохраняется в текстовом файле с расширением .pft. Такой файл обычно называют файл формата.

Начало знакомства с языком форматирования ИРБИС

Для понимания языка форматирования необходимо быть знакомым с такими понятиями как: поле данных - структурная единица документа (записи), имеющая числовую идентификацию (метку поля) и содержащая один элемент описания (например, первый индивидуальный автор, основное заглавие и т.д.): подполе - структурная единица поля, которая определяется двумя сим-волами, предшествующими собственно данным подполя: первый из этих сим-волов знак ^, второй символ может быть латинской буквой (прописные и строчные не различаются) или цифрой и называется разделителем подполя.

Для новичков может показаться, что некоторые форматы являются очень сложными для понимания. Однако, все форматы, даже громоздкие, состоят по сути из довольно простых команд или функций, разделенных запятыми или пробелами. Кажущаяся сложность связана с тем, что формат может состоять из многих таких команд. В связи с этим, ключом к пониманию форматов является последовательный анализ всех присутствующих в них команд.

Обрабатывая формат, система работает с тремя объектами: запись (документ) базы данных, собственно формат и рабочая область, в которой размещаются выходные данные. Команды выполняются последовательно в порядке их представления в формате. Одни из команд порождают выходные данные (например, значения полей данных), другие - инициируют некоторые действия (например, переход на другую строку, создание нескольких пустых строк и т.д.). Создаваемые данные запоминаются в рабочей области в виде текстовых строк, которые затем передаются для последующей обработки, например, для печати.

Все команды форматирования могут вводиться прописными или строчными буквами или их комбинацией. В форматах могут присутствовать комментарии. Признаком начала комментария является комбинация символов /*. В качестве комментария принимается часть строки от признака начала комментария до конца строки.

Запись в базе данных, используемая в примерах

Если не оговорено противное, то все примеры по форматированию в последующих разделах ссылаются на запись, приведенную ниже. Эта запись присутствует в базе данных IBIS, поставляемой в дистрибутивном варианте системы в качестве учебной.

MFN: 34
600: ^AСухой П.О.^Bо нем
215: ^a383^cил.24л
920: PAZK
999: 0000000
907: ^A19941123^bdsm
964: 78.09.19
10:  ^a5-203-01472-8^dЦ.договор.
101: rus
102: RU
900: ^b05^c22
210: ^cВоенное изд-во^aМ.^d1993
700: ^aКузьмина^bЛ.М.
675: 623.746
675: 623.746(092) Сухой П.О.
908: К89
903: 623.746/К89-239165
910: ^A0^BЭ93-18430^C19930830^Dхр
910: ^A2^Dхр
200: ^aКонструктор Сухой. Люди и самолеты

Команды вывода полей

Команды вывода полей – это команды, используемые для извлечения из записи и вывода конкретного поля или подполя. Имеется специальная команда для извлечения и вывода номера записи MFN, хотя, строго говоря, MFN не является полем (MFN не имеет метки).

Команда вывода поля

Для указания на необходимость вывода поля из записи необходимо записать букву V, за которой должна следовать метка поля. Это может быть прописная или строчная буква. Ниже приведены примеры применения данной команды.

Формат Выходные данные
v210 ^cВоенное изд-во^aМ.^d1993
v200 aКонструктор Сухой. Люди и самолеты
v700 ^aКузьмина^bЛ.М.
v600 ^AСухой П.О.^Bо нем

Команда вывода подполя

Для вывода конкретного подполя из данного поля следует добавить соответствующий разделитель подполей к метке поля. Заметим, что можно использовать специальный разделитель подполей ^* для вывода первого подполя, если оно есть. В этом случае, первому подполю необязательно должен предшествовать его разделитель. Разделитель подполей может быть прописной или строчной буквой (обязательно латинской).

Формат Выходные данные
v210^с Военное изд-во
v200^a Конструктор Сухой. Люди и самолеты
v700^a Кузьмина
v600^* Сухой П.О.

Вывод фрагмента поля или подполя

В некоторых случаях может возникнуть необходимость вывести часть поля, которая не является подполем, особенно тогда, когда поле имеет фиксированный формат (например, запись даты в виде ГГГГММДД). Это можно сделать командой смещение/длина, размещаемой сразу за командой вывода поля или подполя, к которому команда применяется.

Эта команда имеет вид:

*<смещение>.<длина>

где:

  • *<смещение> указывает позицию первого символа фрагмента, который должен быть извлечен из поля или подполя (позиции символов нумеруются с нуля, т.е. первый символ находится в позиции 0, второй - в позиции 1 и т.д.); если смещение не указано, то оно считается равным 0;
  • .<длина> указывает количество извлекаемых символов. Если длина опущена, то извлекается все поле (подполе) до конца, начиная с символа, указанного в смещении.

Ниже приведены примеры использования команды по отношению к записи, которая в качестве поля с меткой 1 содержит значение 88-Nov-05.

Формат Выходные данные
v1*3.3 Nov
v1.2 88
v1*7 05
v1*7,v1*2.4 05-Nov
v1*7,v1*2.5,v1.2 05-Nov-88
v210.3 ^cВ
v210^c.3 Вое

Обратите внимание на различные способы манипулирования полями с подполями в последних двух примерах. Если производится ссылка на поле целиком (например, v210), то нулевое смещение указывает на первую фактическую позицию поля (включая возможные разделители, стоящие в начале), а при ссылке на подполе (например, v210^с) нулевое смещение указывает на первый символ данных, стоящий после разделителя подполей.

Команда вывода MFN

Для вывода номера записи в файле документов служит команда MFN, формат которой:

MFN

или

MFN(d)

где d – количество выводимых на экран цифр. Если параметр (d) опущен, то по умолчанию предполагается 6 цифр. Ниже приводятся примеры использования данной команды.

Формат Выходные данные
MFN 000034
MFN(3) 034
MFN(2) 34
MFN(1) 3

Заметим, что для подавления в MFN впереди стоящих нулей можно использовать функцию F.

Команды режима вывода

Система может выводить данные в трех различных режимах: режим проверки, режим заголовка, режим данных.

В режиме проверки поля выводятся в том виде, в каком они хранятся в записи. При этом система не обеспечивает никаких разделителей между полями или экземплярами повторяющихся полей. Пользователь должен обеспечить адекватное разделение полей с помощью команд размещения, литералов или повторяющихся групп. Режим обычно используется для вывода записей с целью проверки правильности введенных данных.

Режим заголовка обычно используется для печати заголовков при выводе указателей и таблиц. Все управляющие символы, введенные вместе с данными, такие как разделители терминов (< и >) игнорируются (за исключением указанных ниже случаев), а разделители подполей заменяются знаками пунктуации.

Режим данных похож на режим заголовка, но дополнительно после каждого поля автоматически ставится точка (.), за которой следуют два пробела (или просто два пробела, если поле заканчивается каким-либо знаком пунктуации). Отметим, однако, что эта автоматическая пунктуация подавляется, если за командой вывода поля следует суффикс-литерал.

Когда система форматирует поле, содержащее подполе, в режимах заголовка или данных, она автоматически заменяет имеющиеся разделители подполей знаками пунктуации (при этом разделитель первого подполя, если он имеется, всегда игнорируется). Специальная комбинация символов "><" заме-няется на "; " (а отдельные символы “<” и “>” подавляются), обеспечивая простой способ форматирования полей, содержащих перечень ключевых фраз, заключенных в угловые скобки. Таблица стандартного замещения разделителей подполей выглядит так:

  • ^a замещается на "; "
  • от ^b до ^i замещается на ", "
  • все другие замещаются на ". "

Команды режима вывода представляются в виде Mmc, где:

  • М – признак команды режима вывода.
  • m следующим образом определяет режим вывода:
    • Р режим проверки;
    • H режим заголовка;
    • D режим данных.
  • с – определяет необходимость преобразования букв в прописные:
    • U буквы преобразуются в прописные;
    • L буквы преобразованию не подвергаются.

Команда режима вывода может появляться в формате столько раз, сколько это нужно и действует до следующей команды режима вывода. По умолчанию система использует команду MPL. Ниже приведены примеры использования команды.

Формат Выходные данные
mpl,v200 ^aКонструктор Сухой. Люди и самолеты
mhl,v200 Конструктор Сухой. Люди и самолеты
mdl,v200 Конструктор Сухой. Люди и самолеты.
mdu,v200 КОНСТРУКТОР СУХОЙ. ЛЮДИ И САМОЛЕТЫ.
mpl,v210 ^cВоенное изд-во^aМ.^d1993
mdl,v210 Военное изд-во; М., 1993.

Команды горизонтального и вертикального размещения

В языке форматирования имеются следующие команды для управления горизонтальным и вертикальным размещением данных:

  • Xn – вставляет n пробелов;
  • Cn – табуляция в позицию n;
  • / – переход на новую строку, если предыдущая строка не была пустой;
  • # – безусловный переход на новую строку;
  • % – удаляет пустые строки (если они есть).

Команда / приводит к размещению последующих данных с начала следующей строки. Подряд расположенные команды / эквивалентны одной команде /. Команда / никогда не создает пустых строк.

Команда # выполняет те же действия, что и /, но переход на новую строку является безусловным.

Можно использовать комбинацию /# для создания одной (и только одной) пустой строки. Комбинация ## может привести к созданию одной или двух пустых строк в зависимости от того, была ли пустой текущая строка перед выполнением первой команды #.

Использование команды # может вызвать затруднение в тех случаях, когда выбираемое поле оказывается пустым. Эта ситуация хорошо иллюстрируется на следующем примере:

/#V10/#V20/#V30

Если все поля присутствуют в документе, то в результате поля 10, 20, и 30 будут располагаться с начала строк и каждому будет предшествовать одна пустая строка. Однако, если поле 20 в документе отсутствует, то между 10 и 30 полями будут вставлены две пустые строки. Это может оказаться нежелательным, если действительно требуется, чтобы между полями была пропущена именно одна пустая строка, независимо от наличия или отсутствия некоторых полей. Таким образом, приведенный выше формат не приведет к желаемому результату.

Эту проблему решает команда %. Ее действие заключается в подавлении всех последовательно расположенных пустых строк, если они имеются, между текущей строкой и последней непустой строкой. Таким образом, формат

%##V10%##V20%##V30 ...

приведет к созданию одной и только одной пустой строки между каждым полем, независимо от их наличия или отсутствия в документе.

Команду Сn имеет смысл применять только в случае использования моноширинных шрифтов. Команды / # % не применимы в случае использования в форматах показа средств RTF или HTML. Команды Сn и Xn не работают в HTML-форматах.


Подключение программ к формату (форматные выходы)

В формате вывода можно использовать программные функции, предназначенные для выполнения таких операций по форматированию, которые не могут быть выполнены с помощью собственно языка форматирования. Такие функции, подключаемые к формату, называются форматные выходы или формат-программы. По сути данные функции выходят за рамки собственно языка форматирования, а сама система просто предоставляет некоторый стандартный интерфейс передачи данных для таких функций.

С точки зрения языка форматирования формат-программы являются строковыми функциями с форматом в качестве аргумента. При этом сначала вычисляется аргумент, а затем он передается функции. Формат-программа возвращает строку символов, с которой система обращается так, как если бы она была полем форматируемого документа.

Обращение к формат-программе в формате производится следующим образом:

&имя(формат)

где:

  • & – идентификатор вызова формат-программы;
  • имя – имя формат-программы;
  • формат – аргумент.

Система предлагает для использования комплексную формат-программу UNIFOR, реализующую различные специфические функции.