The UNESCO micro CDS/ISIS Software
17. Адаптация CDS/ISIS для локальных применений
17.1. Создание новой языковой версии
Для создания новой языковой версии системы, СDS/ISIS необ-
ходимо перевести все меню, системные рабочие листы и сообщения
на язык, который будет применяться.
17.1.1. Перевод меню и системных рабочих листов
Модифицируйте все меню хХLNG для включения нового языка и
создайте новое меню хХLNG, соответствующее новому языку. Для
каждого меню или системного рабочего листа используются средст-
ва программы ISISUTL для копирования английского меню в новое
языковое меню: опция "D" меню хХМ2 (для рабочих листов) или
хХМ3 (для меню). Затем, используя редактор, переведите загла-
вия. Имя нового языкового рабочего листа или меню должно быть
таким же, как имя в английской версии, исключая код языка. Нап-
ример, имя французской версии меню EXGEN будет FXGEN. Во всех
меню, включающих опцию "L", измените имя меню хХLNG, которое
будет выбираться, на имя хХLNG на новом языке. Например, в меню
EXGEN опция "L" указывает меню EXLNG; в меню FXGEN она должна
указывать на FXLNG, где название языка будет на французском.
Если изменяется идентификатор опции в меню, необходимо обеспе-
чить правильный внешний идентификатор опции (см. раздел 16.1.7.
"Внутренний идентификатор опции"). В этом случае необходимо
иметь распечатку копии первоначальных английских меню, постав-
ляемых UNESCO. При переводе системных рабочих листов, помните,
что все рабочие листы одного типа должны иметь одинаковое коли-
чество полей ( включая поля заглавий), порядок полей должен
быть таким же как в первоначальной версии, поставляемой UNESCO.
17.1.2. Перевод сообщений.
Перевод системных сообщений осуществляется следующим обра-
зом:
1. Создайте базу данных системных сообщений на новом языке,
копируя все файлы базы данных английских сообщений; для выпол-
нения этого используйте следующие команды MS DOS:
COPY EMSG.* хMSG.*
COPY ?EMSG.FMT ?хMSG.FMT
где х- код нового языка.
2. Выберите опцию ввода данных для базы данных хMSG и пе-
реведите все сообщения. Будьте осторожны при переводе сообще-
ний, которые используются как заголовки таблиц (6, 42, 248,
271, 272, 283), в смысле сохранения того же расположения, что и
в английской версии. Обратите внимание, что следующие группы
сообщений должны иметь одинаковую длину (в случае необходимос-
ти, более короткое сообщение заполните пробелами) в каждой язы-
ковой версии:
75, 76, 77, 78
86, 87, 88, 89
101,102
3. Кроме того, строки, составляющие вспомагательные меню,
не могут быть длиннее 80 символов, иначе они могут вызвать не-
желательное сворачивание экрана. Вспомогательные меню, в кото-
рых может возникнуть такая ситуация, перечислены ниже:
49, 50
51, 52
54, 55
56
61, 62
71, 72
103, 104, 105
4. Сообщение 434 ( в базе данных английских сообщений) со-
держит текст [не определено]. Он используется для обеспечения
текста при печати для неопределенных сообщений в различных язы-
ковых версиях при печати файла сообщений. Просто переводите это
сообщение в новый язык (например [no asignado] по испански).
Все неопределенные сообщения будут затем печатать это сообщение
в списке при перечислении сообщений базы данных при использова-
нии опции "D" программы ISISUTL. Заметим, что главные файлы со-
общений в отличие от других главных файлов, хранятся особым об-
разом, для того, чтобы оптимизировать время доступа. В частнос-
ти, записи в главном файле сообщений не могут превышать 512
символов и иметь больше 10 сообщений на одну запись. Поэтому,
при переводе файла сообщений необходимо помнить об этих ограни-
чениях.
"Список английских сообщений",этого руководства содержит
полный список английских сообщений, поставляемых UNESCO. Этот
список был выполнен при использовании опции "D" главного меню
программы ISISUTL. После того, как будет переведен файл сообще-
ний,можно создать список сообщений, используя эту же опцию, с
предварительным выбором нового кода языка, используя опцию L.
17.1.3. Создание опций вспомагательного меню
Можно создать опции вспомагательного меню, удовлетворяющие
определенным требованиям данного языка. Аналогично меню,
CDS/ISIS должен быть в состоянии унифицировать опцию, выбранную
пользователем из вспомагательного меню. Внутренние идентифика-
торы вспомагательного меню должны быть такими же, как первона-
чально созданные UNESCO в файле английских сообщений. Если не-
обходимо изменить идентификатор опции в данном вспомагательном
меню, необходимо создать соответствующую таблицу между внешним
и внутренним идентификаторами опций. Эта таблица сохраняется в
конце каждой строки вспомагательного меню в следующем виде:
$e1i1e2i2e3i3....
где - e1,e2 и т.д. являются внешними идентификаторами оп-
ций, а i1,i2 и т.д. являются соответствующими внут-
ренними идентификаторами опций.
Например: предположим, что необходимо изменить вспомага-
тельное меню 51/52.
Атрибуты поля N[нормальное] R[обратное изображение]
U[подчеркнутое] B[мигающее]
H[яркое] I[невидимое]
Данное сообщение изменяется следующим образом:
Атрибуты поля N[нормальное] R[обратное изображение]
U[подчеркнутое] B[мигающее]
H[яркое]$NOR1H2 I[невидимое]$U3B415
17.2. Псевдосообщения
Некоторые сообщения, хранящиеся в базе данных сообщений,
не используются как подсказки, а определяют системные парамет-
ры. (Другие системные параметры определены в файле SYSPAR.PAR
(см. раздел 2.1.1."SYSPAR.PAR: Глобальные параметры").
Подобные сообщения описываются ниже.
273: первый символ данного сообщения определяет графичес-
кие символы, которые будут использоваться редактором
строк для заголовков таблиц ТОП и ТВП (по умолчанию
"-")
274: данное сообщение предоставляет разделитель, который
будет использоваться программой ISISPRT при распечат-
ке индекса (по умолчанию ",")
251: первые восемь символов данного сообщения предоставля-
ют характеристики изображения, которые используются
для обозначения фона экрана, области сообщений, нор-
мального изображения, обратного изображения, жирного,
подчеркнутого, мигающего и невидимого изображения со-
ответственно. Они могут быть изменены с помощью опции
"А" программы ISISUTL.
354: если существует, то содержит адрес сегмента поддержи-
вающего буфера изображения адаптера дисплея.
Адрес должен быть введен в виде фиксированного десятичного чис-
ла с предшествующим символом # (т.е. #В000). Это относится
только к IBM-PC версии CDS/ISIS, которая использует карту памя-
ти, как средство изображения экрана (другие версии такие как
VAХ, WANG или арабская версия не используют такой карты памяти
дисплея). В файлах сообщений поставляемых UNESCO, это сообщение
не определено. CDS/ISIS будет автоматически определять правиль-
ность адреса, поддерживающего буфера изображения, проверяя тип
адаптера , установленного на вашем компьютере (# В800 для од-
ноцветного адаптера дисплея и#В000 для цветного/графического
адаптера). Однако, если используется компьютер с нестандартным
адаптером дисплея, можно указать здесь соответствующий адрес
сегмента. Заметим, что это сообщение должно быть модифицировано
первым на IBM компьютере. Эти сообщения не могут модифициро-
ваться во время создания новой языковой версии.
17.3. Создание файла стоп-слов
Это очень простой текстовый файл, который можно создать
используя стандартный редактор, например EDLIN. Он содержит од-
но слово на строку, причем стоп-слова должны быть набраны на
верхнем регистре, выровнены по левому краю (т.е. начинаться с 1
колонки) и быть выстроены в алфавитном порядке. Максимальное
количество слов, которые составляют файл стоп-слов равно 799 и
каждое слово не должно превышать 10 символов. Пример файла
стоп-слов приведен ниже:
A
AN
AND
AS
BY
FOR
FROM
IN
INTO
ITS
OF
ON
THE
TO
UPON
WITH
Файл стоп-слов, используемый совместно с ТВП для инверти-
рованного файла, должен иметь такое же имя как и база данных с
файловым расширением STW. Другие файлы стоп-слов, используемые
с программами печати, могут иметь любое имя, но обязательно с
расширением STW.
17.4. Создание файла ANY
ANY файл является текстовым файлом, который можно создать,
используя стандартный редактор, например EDLIN. Каждая строка
содержит ANY термин, расположенный в первой позиции (левое вы-
равнивание) и соответствующий поисковый термин, расположенный в
позиции 31 (также левое выравнивание). ANY термин и соответст-
вующие поисковые термины могут вводиться как на верхнем так и
на нижнем регистре или комбинироваться из двух. ANY файл должен
иметь такое же имя как и база данных с файловым расширением
ANY. Пример ANY файла дан ниже.
ANY SCANDINAVIA SCANDINAVIA
ANY SCANDINAVIA DENMARK
ANY SCANDINAVIA FAROE ISLANDS
ANY SCANDINAVIA FINLAND
ANY SCANDINAVIA GREENLAND
ANY SCANDINAVIA ICELAND
ANY SCANDINAVIA NORWAY
ANY SCANDINAVIA SWEDEN
ANY CARIBBEAN CARIBBEAN
ANY CARIBBEAN BAHAMAS
ANY CARIBBEAN BRITISH VIRGIN ISLANDS
ANY CARIBBEAN CAYMAN ISLANDS
17.5. Таблица преобразования в прописные буквы (ISISUC.TAB).
Этот текстовый файл используется для преобразования текста
в прописные буквы. Он содержит десятичный код ASCII прописных
букв, эквивалентный каждому из 256 символов. Преобразование в
прописные буквы осуществляется заменой данного символа текста
на соответствующий код данной таблицы. Обратите внимание, что
таблица должна содержать 256 кодов. Символы, которые не являют-
ся буквенными, остаются неизменными. Стандартная таблица, пос-
тавляемая UNESCO для IBM PC версии , приводится ниже (для WANG
PC и VAX версии используются другие таблицы):
000 001 002 003 004 005 006 007 008 009 010 011 012 013 014 015
016 017 018 019 020 021 022 023 024 025 026 027 028 028 030 031
032 033 034 035 036 037 038 039 040 041 042 043 044 045 046 047
048 049 050 051 052 053 054 055 056 057 058 059 060 061 062 063
064 065 066 067 068 069 070 071 072 073 074 075 076 077 078 079
080 081 082 083 084 085 086 087 088 089 090 091 092 093 094 095
096 065 066 067 068 069 070 071 072 073 074 075 076 077 078 079
080 081 082 083 084 085 086 087 088 089 090 123 124 125 126 127
067 085 069 065 065 065 065 067 069 069 069 073 073 073 065 065
069 069 069 079 079 079 085 085 089 079 085 155 156 157 158 159
065 073 079 085 078 078 166 167 168 169 170 171 172 173 174 175
176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191
192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207
208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223
224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239
240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255
Заметим, что знаки с ударением преобразуются в их вариант
прописных букв без ударения. ISISUC.TAB может содержать две
256-символьные таблицы. Вторая таблица, если опущена, по умол-
чанию, будет эквивалентна первой. Первая таблица используется
для перевода поисковых терминов в прописные буквы перед сохра-
нением их в инвертированном файле, и переводит текст в пропис-
ные буквы, когда соответствующий режим выбирается в дисплейном
формате (mpu, mhu или mdu). Вторая таблица используется для пе-
ревода ключей сортировки перед сохранением их в файле связей.
Это вызвано тем, что некоторые языки требуют специальной сорти-
ровочной последовательности, которая отличается от обычной
ASCII последовательности.
Таблица перевода ключей сортировки, используемая в
ISISUC.ТАВ является системной таблицей по умолчанию. Кроме то-
го, можно указать специальную таблицу ключей сортировки для
каждой базы данных, с помощью создания файла хххххх.SRT (где
хххххх - имя базы данных) в директории базы данных. Если этот
файл существует, CDS/ISIS будет использовать его для генерации
ключей сортировки базы данных. В случае отсутствия, будет ис-
пользоваться системная таблица по умолчанию, сохраненная в
ISISUC.TAB.
Заметим, что так как ключи сортировки переводятся после
выполнения выбора формата данных ТВП, если указывается таблица
перевода ключей сортировки, необходимо обычно избегать исполь-
зования команд режима, требующих перевода в прописные буквы
(mdu, mpu или mhu) в данном формате.
17.6. Таблица буквенных символов (ISISAC.TAB)
Этот текстовой файл содержит десятичный код ASCII всех
буквенных символов. Он используется всякий раз, когда CDS/ISIS
необходимо узнать, является ли данный символ алфавитным (т.е.
когда осуществляется индексирование слова с использованием тех-
ники индексирования 4 или проверка правильности алфавитных по-
лей). Стандартная таблица, поставляемая UNESCO для IBM PC вер-
сии, приводится ниже (другие таблицы используются для WANG PC и
VAX версий):
065 066 067 068 069 070 071 072 073 074 075 076 077 078 079 080
081 082 082 083 084 085 086 087 088 089 090 097 099 100 101 102
103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118
119 120 121 122 128 129 130 131 132 133 134 135 136 137 138 139
140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 160
161 162 163 164 165
Обратите внимание, что знаки с ударением рассматриваются
как алфавитные.
[К оглавлению]