Статистика
Режим СТАТИСТИКА
Режим предназначен для формирования статистических распределений документов БД по значениям различных элементов описания - в качестве таковых имеет смысл рассматривать те элементы описания, которые принимают значения из некоторого конечного списка (например: коды классификаторов, коды видов документов, коды стран, коды языков и т.п.).
Статистические распределения представляются в виде табличных форм, имеющих две колонки: в первой указываются значения элемента описания, во второй - количество документов, содержащих данное значение. Данные стати-стических распределений могут быть использованы для содержательного анализа состава БД.
Следует помнить, что режим статистической обработки связан с текущим контекстом работы, т.е. если установлен контекст НОВЫЙ/MFN, предполагается статобработка документов из текущей базы данных по номерам (MFN); если установлен контекст РЕЗУЛЬТАТЫ ПОИСКА, предполагается статобработка результатов поиска по текущему запросу. В частности, если, например, уста-новлен контекст РЕЗУЛЬТАТЫ ПОИСКА и не выбран ни один из запросов (это может быть, когда не проводился ни один поиск) или выбран запрос с нулевым результатом поиска, то режим СТАТИСТИКА недоступен (не запускается).
Информация о том, по каким элементам описания проводить статистический анализ, а также какие документы должны участвовать в обработке, указы-вается с помощью соответствующей формы (см. рис. 3.7.10а).
В качестве исходных документов, подвергающихся статистической обработке, можно задать: ВСЕ - в этом случае статобработке будут подвергаться все документы в соответствии с контекстом работы: если установлен контекст НОВЫЙ/MFN - все документы текущей базы данных; если контекст РЕЗУЛЬТАТЫ ПОИСКА - полностью результат поиска по текущему запросу;
ОТМЕЧЕННЫЕ - при этом статобработке будут подвергаться только документы, отмеченные в текущем контексте (имеет смысл только в случае, когда таковые имеются);
КРОМЕ ОТМЕЧЕННЫХ - статобработке будут подвергаться все документы текущего контекста за исключением отмеченных (при отсутствии отмеченных это равносильно значению ВСЕ);
ДИАПАЗОН MFN - статобработке будут подвергаться документы текущего контекста, попадающие в указанный диапазон внутренних номеров (MFN). Например, если установлен контекст РЕЗУЛЬТАТЫ ПОИСКА, берутся документы из результата поиска, чьи номера попадают в указанный диапазон.
Рис. 3.7.10а. Форма для ввода задания на статобработку
Параметры собственно статистической обработки указывается в таблице ЗАДАНИЕ НА СТАТ.ОБРАБОТКУ. Одно статистическое распределение определяется одной строкой данной таблицы. За один прогон режима может быть сформировано произвольное число статистических распределений. Новые строки таблицы образуются при щелчке мышью по колонке нумерации строк. Для задания каждого статистического распределения указываются четыре параметра (в соответствующих колонках таблицы):
ЭЛЕМЕНТ - параметр определяет элемент описания, по которому должно быть сформировано статистическое распределение. Задается с помощью ниспадающего меню. Состав данного меню, т.е. список возможных элементов описания для статистической обработки по умолчанию содержится в справочнике STT.MNU (имя данного справочника определяется параметром STTMNU – см. Приложение 1). Элемент статистики в справочнике STT.MNU может задаваться тремя способами: непосредственно конструкция метка_поля^подполе (например, 900^c); непосредственный формат (например, (v102/)); имя формата с предшествующим символом @;
ДЛИНА ЗНАЧЕНИЯ - параметр определяет максимальную длину (в символах) значений элемента описания. Значение по умолчанию - 10;
КОЛ-ВО ЗНАЧЕНИЙ - параметр определяет максимальное количество возможных значений элемента описания. Значение по умолчанию - 1000;
СОРТИРОВКА - параметр определяет порядок сортировки статистического распределения. Возможны четыре значения: НЕТ – сортировка не производится; ПО ЗНАЧЕНИЮ - сортировка по значениям элемента описания; ПО КОЛИЧЕСТВУ (УБЫВАНИЕ) - сортировка по количеству документов в порядке убывания; ПО КОЛИЧЕСТВУ (ВОЗРАСТАНИЕ) - сортировка по количеству до-кументов в порядке возрастания.
Результаты статобработки, т.е. таблицы статистических распределений, могут сохраняться в файле (параметр ВЫХОДНОЙ НОСИТЕЛЬ/ФАЙЛ) в формате RTF или непосредственно выводиться на печатающее устройство (пара-метр ВЫХОДНОЙ НОСИТЕЛЬ/БУМАГА).
Собственно процесс статобработки начинается после нажатия кнопки ВЫПОЛНИТЬ. Если в качестве выходного носителя выбран файл, система дополнительно предлагает стандартное диалоговое окно для указания пути и имени файла сохранения результатов статобработки.