1.3. Структура базы данных

The UNESCO micro CDS/ISIS Software

Хотя база данных CDS/ISIS кажется пользователю целостным файлом информации, в действительности она состоит из множества логически связанных, но физически различных файлов. Управление физическими файлами есть функция CDS/ISIS и пользователю не требуется знать их детальную структуру.

Раздел 1

1.3.1. Определение файлов базы данных

Перед тем как создать БД, необходимо определить файлы базы данных. Эти файлы должны стать известными CDS/ISIS, а следовательно они должны быть описанными определенными характеристиками и удовлетворять структуре записи.

Описание БД CDS/ISIS состоит из следующих составляющих, каждая из которых содержится в отдельном файле:

Таблица Определения Полей (ТОП или FDT) определяет поля, которые могут присутствовать в записях базы данных и их характеристики (FDT более полно описано в разделе 3.1 "Таблица Определения Полей ").

Рабочие листы для ввода данных: один или более экранных форматов,используемых для создания и/или обновления записей главного файла БД.СDS/ISIS содержит специальный редактор для создания этих; рабочих листов (см. раздел 15 "Редактор рабочих листов").

Формат вывода: Формат вывода определяет требования по форматированию каждой строки экрана записи или форматы печати выходных результатов таких как каталог и индексы. CDS/ISIS обеспечивает мощный и всесторонний язык форматирования, который позволяет отображать содержимое записи в любом требуемом представлении.Это описано в разделе 3.2 "Язык форматирования" .

Таблица выбора полей (ТВП или FST): Единственная ТВП описывает поля базы данных, делает их поисковыми через инвертированный файл. Дополнительно ТВП описывает требования многоаспектной сортировки для БД. ТВП или FST описана в разделе 3.4 "Таблица выбора полей ".

1.3.2. Главный файл

Главный файл состоит их всех записей данной БД, каждая запись состоит из множества полей переменной длины. Каждая запись идентифицирована уникальным числом, автоматически присвоенным CDS/ISIS при ее создании, и названная Номер Главного файла или MFN.

Для того, чтобы обеспечить быстрый доступ к каждой записи главного файла, CDS/ISIS соединяет специальные файлы в Главный файл, названный Файлом перекрестных ссылок, который на самом деле присваивает индекс каждой записи и затем размещает ее в главном файле.

Вы можете создать, модифицировать или удалить записи Главного файла посредством меню ввода данных, используя программу ISISENT.

1.3.3. Инвертированный файл

Несмотря на то, что запись главного файла может быть непосредственно найдена своим MFN, необходим дополнительный путь поиска записей через файл перекрестных ссылок.При поиске библиографической записи, желательно чтобы она была доступной по авторам, предметным рубрикам, любым другим элементам данных, встречающимся в записи. CDS/ISIS позволяет обеспечивать фактически неограниченное число терминов доступа для каждой записи через специальный файл, названный ивертированным файлом.

Инвертированный файл включает все термины,которые могут использоваться во время поиска в установленной базе данных, и для каждого термина содержит список указателей на записи главного файла, из которых выделен термин. Набор всех терминов доступа для установленной базы данных называют словарем. Вы можете считать инвертированный файл индексом главного файла.

Для примера, четыре главные записи (с MFN 18,204,766 и 1039) содержат ключ ADULT EDUCATION. Логическая структура записи инвертированного файла будет:

ADULT EDUCATION 18 204 766 1039

Здесь, ADULT EDUCATION является термином доступа (или термином словаря), а каждая ссылка на запись главного файла,называется индексной ссылкой.

Так как каждый термин будет иметь разное число различных записей, индексированных по нему, то логические записи в инвертированном файле будут переменной длины. Кроме того, для того чтобы обеспечивать быстрый поиск каждого термина доступа, инвертированный файл на самом деле состоит из нескольких физических файлов.

CDS/ISIS создает инвертированный файл для каждой базы данных. Вы можете выбирать поля, подполя или элементы подполей для включения в инвертированный файл. Вы можете включать также указанные слова, фразы или дескрипторы из выделеных полей в этот файл.

Вы описываете поисковые элементы при установке базы данных посредством таблицы выбора полей , она содержит поля, которые будут инвертированы и индексированы.Техника индексирования будет применяться для каждого поля. В отличие от других систем поиска, основанных на инвертированных файлах, в которых есть отдельный инвертированный файл для каждого поля, CDS/ISIS использует инвертированный файл для любой установленной БД. Из-за частичной структуры этого файла, это функционально эквивалентно подходу с многими инвертированными файлами. В настоящее время каждая регистрация термина поиска содержит не только MFN, но и также добавочную информацию, точно идентифицирующую поле, из которого были выделены данные, а также относительную позицию слова внутри поля.

Реализованное усовершенствование позволило иметь термины доступа до 30 символов. Элементы, которые длинее чем максимум, преобразуются перед вводом в инвертированный файл.

1.3.4. ANY файл

ANY файл- это необязательный тип файла, связанный с инвертированым файлом. Он используется при поиске через определенные родственные термины. ANY термин есть коллективное имя, присвоенное таблице поисковых терминов. Когда ANY термин используется при поиске, отыскивается таблица с этим именем а индивидуальный термин из таблицы вызывается автоматически. Критерием для создания файла ANY является частая встречаемость термина в запросах. В географических названиях эти термины встречаются чаще всего. Если, например, вы создаете ANY файл - ANY Латинская Америка, который определяет названия всех стран в Латинской Америке, вы можете затем использовать это коллективное имя при поиске.

Использование термина ANY обьясняется более детально в разделе 3.6 "Поисковый язык CDS/ISIS".

1.3.5. Взаимосвязь между файлами

Логическую взаимосвязь между основными файлами БД CDS/ISIS рассмотрим на примере поиска. Поиск в базе осуществляется с целью определения списка MFN, удовлетворяющего данному множеству поисковых терминов.

Если после этого вы запросите вывод на экран найденной записи, CDS/ISIS будет читать каждую запись из главного файла, MFN которой указан в hit списке, и будет форматировать ее в соответствии с указанным форматом и выводить на экран.

Вы можете также сохранить один или более найденных списков, которые позже; можно распечатать, используя возможности программы ISISPRT. Для сохранения полученных списков их заносят в файл, который называется файлом сохранения.