The UNESCO micro CDS/ISIS Software
1. Обзор системы
1.1. База данных CDS/ISIS
CDS/ISIS позволяет вам создавать и управлять структуриро-
ванной числовой базой данных, т.е. содержащей главным образом
текстовые данные.
В самом общем виде можно считать базу данных CDS/ISIS фай-
лом родственных данных, который удовлетворяет общим информаци-
онным требованиям данного пользователя. Это может быть, напри-
мер, простой адресный файл или более сложный файл, такой как
каталог библиотеки или справочная система для научных проек-
тов.Каждая информационная совокупность (обьект) хранится в базе
данных и состоит из отдельных элементов данных, каждый из кото-
рых содержит подробные характерные особенности описанного обь-
екта.Например, библиографическая база данных состоящая из ин-
формации о книгах, отчетах, предметных журналах, и т.д. Каждый
обьект, в этом случае, состоит из таких элементов данных, как
автор, заглавие, дата публикации и т.д.
Элементы данных хранятся в полях, каждому из которых прис-
воена численная метка, характеризующая это содержимое. Вы може-
те считать метку как имя поля узнаваемую системой CDS/ISIS.
Множество полей, содержащее все элементы данных обьекта
предметной области называют записью.
Характерной особенностью CDS/ISIS является то, что в нем
реализована обработка полей (и следовательно записей) перемен-
ной длины, таким образом обеспечивается оптимальное использова-
ние пространства хранения вашего диска, а с другой стороны пре-
доставляется полная свобода в определении максимальной длины
каждого поля.
Поля могут быть необязательными (т.е. они могут отсутство-
вать в одной или более записях), они могут включать знак эле-
мента данных, или два или более переменных длин элементов дан-
ных. В буквальном смысле поле содержит в себе подполя, каждое
из которых идентифицировано 2 символами- ограничителями подпо-
ля, предшествующими соответствующему элементу данных. Более то-
го поле может быть повторяющимся, т.е. некоторые поля записи
могут состоять из более чем одного экземпляра поля.
1.2. Системные функции
Наиболее важные функции, предусмотренные в CDS/ISIS, поз-
воляют вам:
- определить базу данных, содержащую требуемые эле-
менты данных;
- вводить новые записи в установленную базу данных;
- модифицировать, корректировать или удалять хранимые запи-
си;
- автоматически строить и поддерживать файлы быстрого дос-
тупа для каждой базы данных, обеспечивающие максимальную ско-
рость поиска;
- ввосстанавливать содержимое записей;
- отображать записи или их порции в соответствии с вашим
запросом;
- сортировать записи в любой желаемой последовательности;
- смещать память или полные каталоги и/или индексы;
- развивать программно систему, используя Паскаль CDS/ISIS.
Эти средства реализованы посредством 8 больших программ,
классифицированных в две широкие категории: четыре пользова-
тельских программы и четыре системных программы. Пользователь-
ские средства только требуют знаний основных возможностей
CDS/ISIS, тогда как системные средства предполагают углубленное
знание всех компонент системы и знакомства с программированием.
Четыре пользовательских программы обеспечивают следующие
функции:
ISISENT- ввод данных и редактирование записей;
ISISRET- поиск информации;
ISISPRT- печать результатов вывода, например,каталогов и
индексов;
ISISINV- обслуживание инвертированного файла и функций утилит.
Четыре системы программы обеспечивают:
ISISDEF-определение новой базы данных и/или модификацию су-
ществующих определений баз данных;
ISISUTL-средства редактирования системных бланков, меню,
системных сообщений;
ISISХСН-возможности для обмена данными с другими системами и
функции утилит главного файла;
ISISРАS- средства программирования, позволяющие разраба-
тывать программные средства, развивающие возможности CDS/ISIS.
1.3. Структура базы данных
Хотя база данных CDS/ISIS кажется пользователю целостным
файлом информации, в действительности она состоит из множества
логически связанных,но физически различных файлов. Управление
физическими файлами есть функция CDS/ISIS и пользователю не
требуется знать их детальную структуру.
Раздел 1
1.3.1. Определение файлов базы данных
Перед тем как создать БД, необходимо определить файлы базы
данных. Эти файлы должны стать известными CDS/ISIS, а следова-
тельно они должны быть описанными определенными характеристика-
ми и удовлетворять структуре записи.
Описание БД CDS/ISIS состоит из следующих составляющих,
каждая из которых содержится в отдельном файле:
Таблица Определения Полей (ТОП или FDT) определяет поля,
которые могут присутствовать в записях базы данных и их харак-
теристики (FDT более полно описано в разделе 3.1 "Таблица Опре-
деления Полей ").
Рабочие листы для ввода данных: один или более экранных
форматов,используемых для создания и/или обновления записей
главного файла БД.СDS/ISIS содержит специальный редактор для
создания этих рабочих листов (см. раздел 15 "Редактор рабочих
листов").
Формат вывода: Формат вывода определяет требования по фор-
матированию каждой строки экрана записи или форматы печати вы-
ходных результатов таких как каталог и индексы. CDS/ISIS обес-
печивает мощный и всесторонний язык форматирования, который
позволяет отображать содержимое записи в любом требуемом предс-
тавлении.Это описано в разделе 3.2 "Язык форматирования" .
Таблица выбора полей (ТВП или FST): Единственная ТВП опи-
сывает поля базы данных, делает их поисковыми через инвертиро-
ванный файл. Дополнительно ТВП описывает требования многоаспек-
тной сортировки для БД. ТВП или FST описана в разделе 3.4 "Таб-
лица выбора полей ".
1.3.2. Главный файл
Главный файл состоит их всех записей данной БД, каждая за-
пись состоит из множества полей переменной длины. Каждая запись
идентифицирована уникальным числом, автоматически присвоенным
CDS/ISIS при ее создании, и названная Номер Главного файла или
MFN.
Для того, чтобы обеспечить быстрый доступ к каждой записи
главного файла, CDS/ISIS соединяет специальные файлы в Главный
файл, названный Файлом перекрестных ссылок, который на самом
деле присваивает индекс каждой записи и затем размещает ее в
главном файле.
Вы можете создать, модифицировать или удалить записи Глав-
ного файла посредством меню ввода данных, используя программу
ISISENT.
1.3.3. Инвертированный файл
Несмотря на то, что запись главного файла может быть не-
посредственно найдена своим MFN, необходим дополнительный путь
поиска записей через файл перекрестных ссылок.При поиске библи-
ографической записи, желательно чтобы она была доступной по ав-
торам, предметным рубрикам, любым другим элементам данных, вст-
речающимся в записи. CDS/ISIS позволяет обеспечивать фактически
неограниченное число терминов доступа для каждой записи через
специальный файл, названный ивертированным файлом.
Инвертированный файл включает все термины,которые могут
использоваться во время поиска в установленной базе данных, и
для каждого термина содержит список указателей на записи глав-
ного файла, из которых выделен термин. Набор всех терминов дос-
тупа для установленной базы данных называют словарем. Вы можете
считать инвертированный файл индексом главного файла.
Для примера, четыре главные записи (с MFN 18,204,766 и
1039) содержат ключ ADULT EDUCATION. Логическая структура запи-
си инвертированного файла будет:
ADULT EDUCATION 18 204 766 1039
Здесь, ADULT EDUCATION является термином доступа (или тер-
мином словаря), а каждая ссылка на запись главного файла,назы-
вается индексной ссылкой.
Так как каждый термин будет иметь разное число различных
записей, индексированных по нему, то логические записи в инвер-
тированном файле будут переменной длины. Кроме того, для того
чтобы обеспечивать быстрый поиск каждого термина доступа, ин-
вертированный файл на самом деле состоит из нескольких физичес-
ких файлов.
CDS/ISIS создает инвертированный файл для каждой базы дан-
ных. Вы можете выбирать поля, подполя или элементы подполей для
включения в инвертированный файл. Вы можете включать также ука-
занные слова, фразы или дескрипторы из выделеных полей в этот
файл.
Вы описываете поисковые элементы при установке базы данных
посредством таблицы выбора полей , она содержит поля, которые
будут инвертированы и индексированы.Техника индексирования бу-
дет применяться для каждого поля. В отличие от других систем
поиска, основанных на инвертированных файлах, в которых есть
отдельный инвертированный файл для каждого поля, CDS/ISIS ис-
пользует инвертированный файл для любой установленной БД. Из-за
частичной структуры этого файла, это функционально эквивалентно
подходу с многими инвертированными файлами. В настоящее время
каждая регистрация термина поиска содержит не только MFN, но и
также добавочную информацию, точно идентифицирующую поле, из
которого были выделены данные, а также относительную позицию
слова внутри поля.
Реализованное усовершенствование позволило иметь термины
доступа до 30 символов. Элементы, которые длинее чем максимум,
преобразуются перед вводом в инвертированный файл.
1.3.4. ANY файл
ANY файл- это необязательный тип файла, связанный с инвер-
тированым файлом. Он используется при поиске через определенные
родственные термины. ANY термин есть коллективное имя, присво-
енное таблице поисковых терминов. Когда ANY термин используется
при поиске, отыскивается таблица с этим именем а индивидуальный
термин из таблицы вызывается автоматически. Критерием для соз-
дания файла ANY является частая встречаемость термина в запро-
сах. В географических названиях эти термины встречаются чаще
всего. Если, например, вы создаете ANY файл - ANY Латинская
Америка, который определяет названия всех стран в Латинской
Америке, вы можете затем использовать это коллективное имя при
поиске.
Использование термина ANY обьясняется более детально в
разделе 3.6 "Поисковый язык CDS/ISIS".
1.3.5. Взаимосвязь между файлами.
Логическую взаимосвязь между основными файлами БД CDS/
ISIS рассмотрим на примере поиска. Поиск в базе осуществляется
с целью определения списка MFN, удовлетворяющего данному мно-
жеству поисковых терминов.
Если после этого вы запросите вывод на экран найденной за-
писи, CDS/ISIS будет читать каждую запись из главного файла,
MFN которой указан в hit списке, и будет форматировать ее в со-
ответствии с указанным форматом и выводить на экран.
Вы можете также сохранить один или более найденных спис-
ков, которые позже можно распечатать, используя возможности
программы ISISPRT. Для сохранения полученных списков их заносят
в файл, который называется файлом сохранения.
1.4. Архитектура системы
Основными компонентами CDS/ISIS есть его системные меню,
которые позволяют вам вызывать различные опции. Однако,для то-
го, чтобы управлять и работать со своей базой данных , вы долж-
ны изучить технические возможности,присущие CDS/ISIS, как нап-
ример поисковый язык или язык форматирования.Возможности реали-
зованы множеством процедур, разработанных CDS/ISIS для этой це-
ли.Например, если вы хотите провести поиск в БД вы сначала дол-
жны выбрать необходимые опции в меню, потом сформировать поис-
ковое предписание по правилам языка поиска СDS/ISIS. Для акту-
ального ввода поиска используйте процедуру CDS/ISIS, называемую
редактор полей.
1.4.1. Меню
Вы выбираете операции, которые будут выполнены с помощью
опций из меню, которые система отображает на экране. Меню-это
список функций из которого вы делаете выбор посредством набора
единственной буквы. Как пример, опции меню по поиску информа-
ции, изображены на рис. 1.
Каждой опции в меню вы ставите в соответствие единственный
символ, который называется идентификатором опции, (например S),
за которым следует обьяснительный текст, названный описанием
опции (например "Формулировка поиска"). Заметим, что различные
системные меню могут в действительности быть отличными от пока-
занных в этом руководстве, так каждый пользователь может менять
набор меню так же хорошо, как связывать опции дескрипторов или
опции идентификаторов . Однако, если используются стандартные
пользовательские процедуры, имя данного меню будет тем же самым
(исключая язык как показано ниже).
Когда меню отображено на экране, позиция курсора CDS/ISIS
находится под следующим символом "?" Выбрав одну из опций, вы
просто вводите соответствующий символ идентификатора опции.
Так, для примера, выбрав опцию "Сохранение результатов поиска",
вы вводите букву Р (которая может быть введена в любом (верхнем
или нижнем) регистре).
1.4.2. Многоязыковый диалог
Все программы работают в режиме диалога и являются многоя-
зыковыми. Последние возможности позволяют вам выбирать язык,в
котором будут изображены системное меню и сообщения.
CDS/ISIS всегда выводит на экран первое меню на языке,
выбранном по умолчанию администратором базы данных, когда сис-
тема устанавливалась на вашей машине. Опция L в этом меню отоб-
ражает меню xXLNG, которое содержит предоставленные языки.
Модель меню xXLNG показана на рис.2 (однако вы должны пом-
нить, что меню xXLNG может выглядеть иначе чем здесь в докумен-
те).
Выбору входного языка соответствует буква (например F для
Французкого). CDS/ISIS затем возвращается в меню, из которого
опция L была выбрана. Начиная из этой точки, все меню, систем-
ные сообщения и подсказки будут выводиться на экран на том язы-
ке, который вы выбрали.
1.4.3. Рабочие листы
Рабочий лист является частным случаем экранного набора,
используемого для ввода данных. Он является эквивалентом печат-
ной формы,которую вы должны запомнить.
Программа ISISRET
Меню EXGEN
Поиск информации в базе данных.
L - Сменить язык диалога
В - Просмотреть файл документов
Т - Просмотреть поисковые термины словаря
S - Подготовить запрс на поиск информации
D - Вывести результаты поиска информации
F - Изменить формат вывода
R - Вывести формулировки запросов данного сеанса
G - Выполнить поиск по предыдущему запросу
Р - Сохранить рузультаты поиска на диске
Х - Выход
?_
Рис.1: Пример меню CDS/ISIS
————————————————————————————————————————————————————————————————
—————————————————————————————————————————————————————————————————
| |
| Меню EXLNG |
| |
| Имеющиеся в наличии диалоговые языки |
| |
| Е - Английский |
| F - Французский |
| S - Испанский |
| ?_ |
| Рис.2: Пример выбора языка меню |
—————————————————————————————————————————————————————————————————
—————————————————————————————————————————————————————————————————
| |
| Меню xXM3 |
| С - Создать новое системное меню |
| D - Копировать меню |
| Е - Редактировать текущее меню |
| F - Удалить меню |
| R - Показать текущее меню |
| S - Выбрать иное системное меню |
| Х - Выход |
| |
—————————————————————————————————————————————————————————————————
Рабочие листы содержат номер по лей, каждое из которых
содержит имя (или метку) и пустое пространство в которое вы бу-
дете вводить соответствующие данные.
В некоторых случаях одно или более полей могут также со-
держать данные. Эти данные называют значения по умолчанию. Ког-
да экрана не достаточно, чтобы содержать полный рабочий лист,
он делится на две или более страниц и вы можете потом применять
команды к соответствующим страницам через свой рабочий лист.
Существует два типа рабочих листов: системные рабочие лис-
ты и рабочие листы по вводу данных.
Системные рабочие листы используются CDS/ISIS для ввода
параметров, которые могут потребоваться при выполнении данных
функций.
Рабочие листы по вводу данных используются для создания и
модификации записи базы данных. Этот тип рабочего листа содер-
жит все поля которые могут присутствовать в данной записи. Поэ-
тому рабочие листы по вводу данных должны быть созданы для каж-
дой БД. Для создания рабочих листов в CDS/ISIS имеются соответ-
ствующие редакторы.
1.5. Системные ограничения
В CDS/ISIS имеются следующие системные ограничения:
Максимальное число баз данных ............ неограниченное
Максимальное число записей в БД .......... 16 млн.
Максимальный размер записи ............... 8000 символов
Максимальное количество полей,определенных
в ТОП (исключая повторения) ............. 200
Максимальное число строк ТВП ............. 200
Максимальный размер поля.................. 8000 символов
Максимальное число полей на странице
рабочего листа ........................... 19
Максимальное число страниц в рабочем листе 20
Максимальный размер формата вывода ....... 4000 символов
Максимальное число стоп-слов ............. 799
1.6. Соглашения, используемые в данном руководстве
Именам меню предшествует строчный символ 'X', который ука-
зывает код языка. Например, xXGEN - имя меню CDS/ISIS, для ко-
торого могут существовать столько версий меню, сколько языков
введено. Например для английской версии -EXGEN, для французской
версии -FXGEN и т.д.
Специальные функциональные клавиши указаны своими именами
и заключены в скобки (например CR). Использованные имена
есть символические имена, указывающие на функции, которые эти
клавиши выполняют.
Также заметьте, что некоторые специальные символы (такие
как @ или !) могут не быть в распоряжении всей клавиатуры. В
этом случае обратитесь к разделу 2.1.1.12 "Параметры описываю-
щие функциональную клавиатура", где дается метод для определе-
ния находящегося символа. Приложение также дает соответствие
между символическими именами функциональной клавиатуры и факти-
ческими клавишами на вашей клавиатуре.
[К оглавлению]