1. Обзор системы

The UNESCO micro CDS/ISIS Software

1.1. База данных CDS/ISIS

CDS/ISIS позволяет вам создавать и управлять структурированной числовой базой данных, т. е. содержащей главным образом текстовые данные.

В самом общем виде можно считать базу данных CDS/ISIS файлом родственных данных, который удовлетворяет общим информационным требованиям данного пользователя. Это может быть, например, простой адресный файл или более сложный файл, такой как каталог библиотеки или справочная система для научных проектов. Каждая информационная совокупность (обьект) хранится в базе данных и состоит из отдельных элементов данных, каждый из которых содержит подробные характерные особенности описанного обьекта. Например, библиографическая база данных состоящая из информации о книгах, отчетах, предметных журналах, и т.д. Каждый обьект, в этом случае, состоит из таких элементов данных, как автор, заглавие, дата публикации и т.д.

Элементы данных хранятся в полях, каждому из которых присвоена численная метка, характеризующая это содержимое. Вы можете считать метку как имя поля узнаваемую системой CDS/ISIS.

Множество полей, содержащее все элементы данных обьекта предметной области называют записью.

Характерной особенностью CDS/ISIS является то, что в нем реализована обработка полей (и следовательно записей) переменной длины, таким образом обеспечивается оптимальное использование пространства хранения вашего диска, а с другой стороны предоставляется полная свобода в определении максимальной длины каждого поля.

Поля могут быть необязательными (т.е. они могут отсутствовать в одной или более записях), они могут включать знак элемента данных, или два или более переменных длин элементов данных. В буквальном смысле поле содержит в себе подполя, каждое из которых идентифицировано 2 символами- ограничителями подполя, предшествующими соответствующему элементу данных. Более того поле может быть повторяющимся, т.е. некоторые поля записи могут состоять из более чем одного экземпляра поля.

1.2. Системные функции

The UNESCO micro CDS/ISIS Software

Наиболее важные функции, предусмотренные в CDS/ISIS, позволяют вам:

  • определить базу данных, содержащую требуемые элементы данных;
  • вводить новые записи в установленную базу данных;
  • модифицировать, корректировать или удалять хранимые записи;
  • автоматически строить и поддерживать файлы быстрого доступа для каждой базы данных, обеспечивающие максимальную скорость поиска;
  • ввосстанавливать содержимое записей;
  • отображать записи или их порции в соответствии с вашим запросом;
  • сортировать записи в любой желаемой последовательности;
  • смещать память или полные каталоги и/или индексы;
  • развивать программно систему, используя Паскаль CDS/ISIS.

Эти средства реализованы посредством 8 больших программ, классифицированных в две широкие категории: четыре пользовательских программы и четыре системных программы. Пользовательские средства только требуют знаний основных возможностей CDS/ISIS, тогда как системные средства предполагают углубленное знание всех компонент системы и знакомства с программированием.

Четыре пользовательских программы обеспечивают следующие функции:

  1. ISISENT- ввод данных и редактирование записей;
  2. ISISRET- поиск информации;
  3. ISISPRT- печать результатов вывода, например,каталогов  и индексов;
  4. ISISINV- обслуживание инвертированного файла и функций утилит.

Четыре системы программы обеспечивают:

  1. ISISDEF-определение новой базы данных и/или модификацию существующих определений баз данных;
  2. ISISUTL-средства редактирования системных бланков, меню,системных сообщений;
  3. ISISХСН-возможности для обмена данными с другими системами и функции утилит главного файла;
  4. ISISРАS- средства программирования, позволяющие разрабатывать программные средства, развивающие возможности CDS/ISIS.

1.3. Структура базы данных

The UNESCO micro CDS/ISIS Software

Хотя база данных CDS/ISIS кажется пользователю целостным файлом информации, в действительности она состоит из множества логически связанных, но физически различных файлов. Управление физическими файлами есть функция CDS/ISIS и пользователю не требуется знать их детальную структуру.

Раздел 1

1.3.1. Определение файлов базы данных

Перед тем как создать БД, необходимо определить файлы базы данных. Эти файлы должны стать известными CDS/ISIS, а следовательно они должны быть описанными определенными характеристиками и удовлетворять структуре записи.

Описание БД CDS/ISIS состоит из следующих составляющих, каждая из которых содержится в отдельном файле:

Таблица Определения Полей (ТОП или FDT) определяет поля, которые могут присутствовать в записях базы данных и их характеристики (FDT более полно описано в разделе 3.1 "Таблица Определения Полей ").

Рабочие листы для ввода данных: один или более экранных форматов,используемых для создания и/или обновления записей главного файла БД.СDS/ISIS содержит специальный редактор для создания этих; рабочих листов (см. раздел 15 "Редактор рабочих листов").

Формат вывода: Формат вывода определяет требования по форматированию каждой строки экрана записи или форматы печати выходных результатов таких как каталог и индексы. CDS/ISIS обеспечивает мощный и всесторонний язык форматирования, который позволяет отображать содержимое записи в любом требуемом представлении.Это описано в разделе 3.2 "Язык форматирования" .

Таблица выбора полей (ТВП или FST): Единственная ТВП описывает поля базы данных, делает их поисковыми через инвертированный файл. Дополнительно ТВП описывает требования многоаспектной сортировки для БД. ТВП или FST описана в разделе 3.4 "Таблица выбора полей ".

1.3.2. Главный файл

Главный файл состоит их всех записей данной БД, каждая запись состоит из множества полей переменной длины. Каждая запись идентифицирована уникальным числом, автоматически присвоенным CDS/ISIS при ее создании, и названная Номер Главного файла или MFN.

Для того, чтобы обеспечить быстрый доступ к каждой записи главного файла, CDS/ISIS соединяет специальные файлы в Главный файл, названный Файлом перекрестных ссылок, который на самом деле присваивает индекс каждой записи и затем размещает ее в главном файле.

Вы можете создать, модифицировать или удалить записи Главного файла посредством меню ввода данных, используя программу ISISENT.

1.3.3. Инвертированный файл

Несмотря на то, что запись главного файла может быть непосредственно найдена своим MFN, необходим дополнительный путь поиска записей через файл перекрестных ссылок.При поиске библиографической записи, желательно чтобы она была доступной по авторам, предметным рубрикам, любым другим элементам данных, встречающимся в записи. CDS/ISIS позволяет обеспечивать фактически неограниченное число терминов доступа для каждой записи через специальный файл, названный ивертированным файлом.

Инвертированный файл включает все термины,которые могут использоваться во время поиска в установленной базе данных, и для каждого термина содержит список указателей на записи главного файла, из которых выделен термин. Набор всех терминов доступа для установленной базы данных называют словарем. Вы можете считать инвертированный файл индексом главного файла.

Для примера, четыре главные записи (с MFN 18,204,766 и 1039) содержат ключ ADULT EDUCATION. Логическая структура записи инвертированного файла будет:

ADULT EDUCATION 18 204 766 1039

Здесь, ADULT EDUCATION является термином доступа (или термином словаря), а каждая ссылка на запись главного файла,называется индексной ссылкой.

Так как каждый термин будет иметь разное число различных записей, индексированных по нему, то логические записи в инвертированном файле будут переменной длины. Кроме того, для того чтобы обеспечивать быстрый поиск каждого термина доступа, инвертированный файл на самом деле состоит из нескольких физических файлов.

CDS/ISIS создает инвертированный файл для каждой базы данных. Вы можете выбирать поля, подполя или элементы подполей для включения в инвертированный файл. Вы можете включать также указанные слова, фразы или дескрипторы из выделеных полей в этот файл.

Вы описываете поисковые элементы при установке базы данных посредством таблицы выбора полей , она содержит поля, которые будут инвертированы и индексированы.Техника индексирования будет применяться для каждого поля. В отличие от других систем поиска, основанных на инвертированных файлах, в которых есть отдельный инвертированный файл для каждого поля, CDS/ISIS использует инвертированный файл для любой установленной БД. Из-за частичной структуры этого файла, это функционально эквивалентно подходу с многими инвертированными файлами. В настоящее время каждая регистрация термина поиска содержит не только MFN, но и также добавочную информацию, точно идентифицирующую поле, из которого были выделены данные, а также относительную позицию слова внутри поля.

Реализованное усовершенствование позволило иметь термины доступа до 30 символов. Элементы, которые длинее чем максимум, преобразуются перед вводом в инвертированный файл.

1.3.4. ANY файл

ANY файл- это необязательный тип файла, связанный с инвертированым файлом. Он используется при поиске через определенные родственные термины. ANY термин есть коллективное имя, присвоенное таблице поисковых терминов. Когда ANY термин используется при поиске, отыскивается таблица с этим именем а индивидуальный термин из таблицы вызывается автоматически. Критерием для создания файла ANY является частая встречаемость термина в запросах. В географических названиях эти термины встречаются чаще всего. Если, например, вы создаете ANY файл - ANY Латинская Америка, который определяет названия всех стран в Латинской Америке, вы можете затем использовать это коллективное имя при поиске.

Использование термина ANY обьясняется более детально в разделе 3.6 "Поисковый язык CDS/ISIS".

1.3.5. Взаимосвязь между файлами

Логическую взаимосвязь между основными файлами БД CDS/ISIS рассмотрим на примере поиска. Поиск в базе осуществляется с целью определения списка MFN, удовлетворяющего данному множеству поисковых терминов.

Если после этого вы запросите вывод на экран найденной записи, CDS/ISIS будет читать каждую запись из главного файла, MFN которой указан в hit списке, и будет форматировать ее в соответствии с указанным форматом и выводить на экран.

Вы можете также сохранить один или более найденных списков, которые позже; можно распечатать, используя возможности программы ISISPRT. Для сохранения полученных списков их заносят в файл, который называется файлом сохранения.

 

1.4. Архитектура системы

The UNESCO micro CDS/ISIS Software

Основными компонентами CDS/ISIS есть его системные меню, которые позволяют вам вызывать различные опции. Однако,для того, чтобы управлять и работать со своей базой данных , вы должны изучить технические возможности,присущие CDS/ISIS, как например поисковый язык или язык форматирования. Возможности реализованы множеством процедур, разработанных CDS/ISIS для этой цели. Например, если вы хотите провести поиск в БД вы сначала должны выбрать необходимые опции в меню, потом сформировать поисковое предписание по правилам языка поиска СDS/ISIS. Для актуального ввода поиска используйте процедуру CDS/ISIS, называемую редактор полей.

1.4.1. Меню

Вы выбираете операции, которые будут выполнены с помощью опций из меню, которые система отображает на экране. Меню - это список функций из которого вы делаете выбор посредством набора единственной буквы. Как пример, опции меню по поиску информации, изображены на рис. 1.

Каждой опции в меню вы ставите в соответствие единственный символ, который называется идентификатором опции, (например S), за которым следует обьяснительный текст, названный описанием опции (например "Формулировка поиска"). Заметим, что различные системные меню могут в действительности быть отличными от показанных в этом руководстве, так каждый пользователь может менять набор меню так же хорошо, как связывать опции дескрипторов или опции идентификаторов. Однако, если используются стандартные пользовательские процедуры, имя данного меню будет тем же самым (исключая язык как показано ниже).

Когда меню отображено на экране, позиция курсора CDS/ISIS находится под следующим символом "?" Выбрав одну из опций, вы просто вводите соответствующий символ идентификатора опции. Так, для примера, выбрав опцию "Сохранение результатов поиска", вы вводите букву Р (которая может быть введена в любом (верхнем или нижнем) регистре).

1.4.2. Многоязыковый диалог

Все программы работают в режиме диалога и являются многоязыковыми. Последние возможности позволяют вам выбирать язык,в котором будут изображены системное меню и сообщения.

CDS/ISIS всегда выводит на экран первое меню на языке, выбранном по умолчанию администратором базы данных, когда система устанавливалась на вашей машине. Опция L в этом меню отображает меню xXLNG, которое содержит предоставленные языки.

Модель меню xXLNG показана на рис.2 (однако вы должны помнить, что меню xXLNG может выглядеть иначе чем здесь в документе).

Выбору входного языка соответствует буква (например F для Французкого). CDS/ISIS затем возвращается в меню, из которого опция L была выбрана. Начиная из этой точки, все меню, системные сообщения и подсказки будут выводиться на экран на том языке, который вы выбрали.

1.4.3. Рабочие листы

Рабочий лист является частным случаем экранного набора, используемого для ввода данных. Он является эквивалентом печатной формы,которую вы должны запомнить.

Программа ISISRET

Меню EXGEN
Поиск информации в базе данных.

L - Сменить язык диалога
В - Просмотреть файл документов
Т - Просмотреть поисковые термины словаря
S - Подготовить запрс на поиск информации
D - Вывести результаты поиска информации
F - Изменить формат вывода
R - Вывести формулировки запросов данного сеанса
G - Выполнить поиск по предыдущему запросу
Р - Сохранить рузультаты поиска на диске
Х - Выход
?_

Рис.1: Пример меню CDS/ISIS

Рис. 2

Меню xXM3

Рабочие листы содержат номер по лей, каждое из которых содержит имя (или метку) и пустое пространство в которое вы будете вводить соответствующие данные.

В некоторых случаях одно или более полей могут также содержать данные. Эти данные называют значения по умолчанию. Когда экрана не достаточно, чтобы содержать полный рабочий лист, он делится на две или более страниц и вы можете потом применять команды к соответствующим страницам через свой рабочий лист.

Существует два типа рабочих листов: системные рабочие листы и рабочие листы по вводу данных.

Системные рабочие листы используются CDS/ISIS для ввода параметров, которые могут потребоваться при выполнении данных функций.

Рабочие листы по вводу данных используются для создания и модификации записи базы данных. Этот тип рабочего листа содержит все поля которые могут присутствовать в данной записи. Поэтому рабочие листы по вводу данных должны быть созданы для каждой БД. Для создания рабочих листов в CDS/ISIS имеются соответствующие редакторы.

1.5. Системные ограничения

The UNESCO micro CDS/ISIS Software

Системные ограничения

1.6. Соглашения, используемые в данном руководстве

The UNESCO micro CDS/ISIS Software

Именам меню предшествует строчный символ 'X', который указывает код языка. Например, xXGEN - имя меню CDS/ISIS, для которого могут существовать столько версий меню, сколько языков введено. Например для английской версии - EXGEN, для французской версии - FXGEN и т. д.

Специальные функциональные клавиши указаны своими именами и заключены в скобки (например CR). Использованные имена есть символические имена, указывающие на функции, которые эти клавиши выполняют.

Также заметьте, что некоторые специальные символы (такие как @ или !) могут не быть в распоряжении всей клавиатуры. В этом случае обратитесь к разделу 2.1.1.12 "Параметры описывающие функциональную клавиатура", где дается метод для определения находящегося символа. Приложение также дает соответствие между символическими именами функциональной клавиатуры и фактическими клавишами на вашей клавиатуре.