Павлуша І.А. Електронні бібліотеки: зарубіжний досвід, питання розробки української концепції // Бібл. вісн. — 1999. — № 4. — С. 13-24.


Павлуша Ірина Анатоліївна
Національна бібліотека України імені В.І. Вернадського, Київ

Електронні бібліотеки:
зарубіжний досвід, питання розробки української концепції

Традиційно основною суперечністю у системі документних комунікацій "джерело інформації — видавництво — документ — бібліотека — споживач інформації" вважається суперечність між обсягом документних ресурсів і можливістю їх використання суспільством. Створення бібліографічної продукції і її доведення до споживачів засобами сучасних комп'ютерних технологій значно зменшили гостроту цієї суто внутрішньої проблеми в системі документних комунікацій.

Сьогодні актуальним стає вже не завдання розв'язання суперечності в рамках підсистеми "документ — споживач інформації", а більш загальна проблема включення всього інтелектуального потенціалу суспільства в систему документних комунікацій і забезпечення його подальшого ефективного використання, тобто вирішення суперечності "джерело інформації — споживач інформації". Вихід цієї проблеми на перший план обумовлений зростанням обсягу знань, що мають фіксуватися в документній формі, з одного боку, і неможливістю видання творів друку значними тиражами (а в ряді випадків і забезпечення появи публікацій взагалі), з іншого. Викладене особливо актуальне для України, де при наявності значного інтелектуального потенціалу (знань науковців і фахівців, які мають кумулюватися і поширюватися в часі і просторі) науково-видавнича діяльність у зв'язку з економічними негараздами не підтримується на належному рівні.

Магістральний напрям вирішення вказаної суперечності — введення в систему документних комунікацій поряд з традиційними і електронних інформаційних ресурсів. Бібліотеки як ключові компоненти цієї системи мають розширити свої функції від збору і бібліографічної обробки друкованої продукції до створення он-лайнових сховищ інформації на різних носіях. При цьому вони трансформуються в "бібліотеки без стін", які не обмежені часом та простором і дають змогу користуватися в будь-який момент потрібним ресурсом, де б він не знаходився.

Трансформація функцій книгозбірень відбивається і в професійній термінології. З'явилися нові поняття "віртуальна бібліотека", "цифрова бібліотека" та "електронна бібліотека", що були запозичені з інформатики. Сьогодні вони не є усталеними, досить часто їх навіть вважають синонімами. Тому доцільно звернути увагу на трактовці цих термінів. Перший з них — "віртуальна бібліотека" (Virtual library) — використовується для визначення загалу інформаційних джерел, які є доступними через глобальні комп'ютерні мережі, що в сукупності утворюють Internet [1]. "Віртуальна бібліотека" не має єдиного місцезнаходження — її ресурси розподілені по всьому світі. Інформаційний потенціал "віртуальної бібліотеки" на кілька порядків перевищує документні ресурси будь-якої книгозбірні і продовжує стрімко збільшуватися. Слід, однак, відзначити, що ряд авторитетних бібліотекознавців вважають використання терміну "віртуальна бібліотека" недоцільним [2, 3] через його метафоричність. Під "цифровою бібліотекою" (Digital library) розуміється бібліотека, в якій вся інформація зберігатиметься в оцифрованому вигляді, не передбачаючи наявності документів на традиційних носіях [4]. В "електронній бібліотеці" (Electronic library) основні процеси (обробка інформації, зберігання і її пошук) здійснюватимуться з використанням комп'ютерів, однак у таких бібліотеках документи на машинних носіях співіснуватимуть з аудіо-, аудіовізуальними та іншими матеріалами [4]. Таким чином "електронна" бібліотека включає в себе й "цифрову", в ній крім суто дискретного представлення документів допускається й їх відбиття в іншій електронній (наприклад, аналоговій) формі. "Цифрова" і "електронна" бібліотеки, на відміну від "віртуальної", являють собою сукупність документів, що мають конкретне місцезнаходження. Можна вважати, що "віртуальна" бібліотека — це інтегровані комп'ютерними мережами "цифрові" та "електронні" бібліотеки.

Електронні бібліотеки країн Заходу

Першим і найбільш відомим проектом створення зібрання електронних версій книг є проект "Гутенберг". Він був започаткований 1971 року М.Хартом, який отримав доступ до потужного на той час комп'ютера Xerox Sigma V у Лабораторії дослідження матеріалів Ілінойського університету. Наданий йому комп'ютерний час М.Харт вирішив використати не для традиційного програмування, а для переведення друкованих книг у електронну форму. Перше, що він зробив у цьому напрямі, — набір тексту Декларації незалежності США. Далі були Біль про права, Конституція США, Біблія, Коран та ін. Так було започатковано формування колекції електронних книг, що сьогодні відома під назвою проект "Гутенберг".

В основу Проекту покладено принцип: все, що введено в пам'ять комп'ютера може бути відтворене у будь-який час, у будь-якому місці. Цей принцип отримав назву Replicator Technology (технологія відтворення). З цього принципу випливає: електронні тексти, що створюються в рамках Проекту, повинні бути представлені в універсальній формі, яка отримала назву Plain Vanilla ASCII (текст без форматування в стандартній кодовій таблиці).

Перша електронна версія художнього твору з'явилася у 1988 р. Це була "Аліса в країні Чудес" Л.Керрола. У 1991 р. на основному Internet-сервері, що підтримує проект "Гутенберг" (ftp://uiarchive.cso.uiuc.edu/pub/etext/gutenberg/) було представлено 12 книг. Сьогодні кількість електронних версій книг на цьому сервері досягає близько 2 тис. В основному це англомовні тексти класиків англійської та американської літератури: проза, поезія, публіцистика, біографії, листи, словники. Всі тексти проходять ретельну редакторську та коректорську перевірку на відповідність оригіналу. Зокрема, кожна електронна версія книги являє собою файл у форматі: filenamexxx.txt, де filename — скорочена назва книги, xxx — кількість редагувань. Наприклад, з імені файла alise30x.txt випливає, що це "Аліса в країні Чудес" Л.Керрола (Alice in Wonderland), яка пройшла 30 редагувань. Всього проект передбачає створення 10 тис. електронних версій книг до 2001 р. (30-річного ювілею Проекту). Відсутність сучасної літератури обумовлена обмеженнями, що випливають з законів про авторське право (без дозволу автора його твір не може бути представлений в Internet). Законодавство США, наприклад, захищає право автора на отримання гонорару впродовж усього життя та 50 років після смерті. При цьому має місце тенденція до збільшення вказаного строку — перший американський закон встановлював період отримання гонорару в 14 років після смерті автора з можливим подвоєнням. Сьогодні Конгрес США розглядає законопроект про збільшення цього строку до 70 років.

Проект "Гутенберг" розпочався на аматорських засадах і існує при незначній спонсорській підтримці. В цьому аспекті суттєву відмінність має інший проект — DLI (Digital Libraries Initiative — Ініціатива цифрових бібліотек), започаткований у США за підтрики NSF (National Science Foundation — Національний науковий фонд), DARPA (Department of Defence Advanced Research Project Agency — Відділ Агенції перспективних досліджень у галузі оборони) і NASA (National Aeronautics and Space Administration — Національна агенція з аеронавтики і космічного простору). Метою цього проекту є "суттєвий прогрес у галузі створення засобів, що призначені для збору, зберігання, організації даних у електронній формі і забезпечення доступу до них з використанням комп'ютерних мереж для пошуку, отримання і обробки необхідної інформації" [5]. Один з важливих аспектів проекту — встановлення більш досконалих зв'язків між фундаментальними науковими дослідженнями й іноваційними технологіями.

Дослідження в галузі цифрових бібліотек пов'язані з багатоаспектними розробками процесів розвитку і використання розподілених баз даних. У таких базах можуть зберігатися текст, графіка, карти, звукові записи, кадри з відео- та кінофільмів і їх комбінації (мультимедіа), що представлені в оцифрованій формі. Дослідження в рамках проекту "Ініціатива цифрових бібліотек" спрямовані також на соціальні, економічні та культурні аспекти розвитку і використання електронних ресурсів. Перша фаза проекту (1994-1998 рр.) має 6 багатогалузевих наукових напрямів, кожний з яких фінансується в обсязі $ 4 млн. У рамках цих напрямів до створення цифрових бібліотек залучаються групи дослідників із ряду університетів США. Їх робота координується одним з 6 університетів — Іллінойський, Каліфорнійський (Берклі), Каліфорнійський (Санта-Барбара), Карнегі Меллон університет, Мічіганський, Стенфордський, — що визнані провідними у певному напрямі. Ілінойський університет зосереджує зусилля на створенні федерального депозитарію наукової періодичної літератури, Каліфорнійський (Берклі) — на формуванні цифрових бібліотек з інформацією про навколишнє середовище (ботаніка, зоологія тощо), Каліфорнійський (Санта-Барбара) — на підтримці цифрових бібліотек з геопросторовою інформацією (карти, аерофотознімки, географічні довідники тощо), Карнегі Меллон університет — на створенні мультимедійних цифрових бібліотек (відеоархіви, матеріали телебачення тощо), Мічіганський — на розробці засобів інтелектуалізації пошуку в розподілених сховищах інформації, Стенфордський — на інтеграції названих сховищ шляхом впровадження інформаційної магістралі з спеціальним протоколом обміну інформацією Infobus. В рамках роботи над проектом партнерські стосунки підтримують понад 75 різних організацій США. Серед них — провідні фірми у галузі виробництва комп'ютерної техніки і телекомунікаційного обладнання, навчальні заклади всіх рівнів, бібліотеки, видавничі організації, урядові та державні агенції, професійні асоціації й інші установи, що зацікавлені у створенні та підтримці великих сховищ інформації і знань.

Друга фаза проекту "Ініціатива цифрових бібліотек", що розпочалася в 1999 р., передбачає активізацію використання інформаційних ресурсів цифрових бібліотек у всіх суспільно значущих сферах діяльності людини [6].

Слід звернути увагу на невідповідність між великим обсягом фінансування проекту "Ініціатива цифрових бібліотек" ($ 24 млн. у 1994-1998 рр.) і незначним отриманим кінцевим результатом. Навіть університети, які виступали координаторами проекту, створили інформаційні сховища обсягом лише у кілька десятків тисяч документів. Причиною цього є вищезгадані обмеження, що випливають з авторського права. Тому основою електронних архівів, які формуються в США, стали не комп'ютерні версії друкованих видань, а довільні комп'ютерні файли. Термін "цифрова бібліотека" не завжди адекватно відбивав їх сутність і ці зібрання почали називати "Electronic Text Center" ("центр електронних текстів").

Про активність США у галузі формування цифрових бібліотек свідчить і створення в 1995 р. Національної федерації цифрових бібліотек, яку утворили 15 університетських бібліотек і Бібліотека Конгресу [7]. Головний отриманий результат Бібліотеки Конгресу США у цьому напрямі — банк даних "Пам'ять Америки" [8]. Це зібрання включає 44 історичні колекції загальним обсягом понад 1 млн. документів, які всебічно відбивають етапи становлення і розвитку США. Згадані документи впорядковані за хронологічною (1400-1699, 1700-1799, 1800-1849, 1850-1899, 1900-1929, 1930-1949, 1950-1969, 1970- по сьогодні), географічною (північ, південь, захід, схід Америки, інші країни) і тематичною (сільське господарство, мистецтво, економіка, освіта, географія, історія, мова та література, політика та право, спорт, соціальні науки, технологія та прикладні науки) ознаками, а також за видами документів (рукописи, стародруки, карти, фотографії, звукові записи тощо). Віддаючи належне внеску Бібліотеки Конгресу США в створення цифрових бібліотек, слід однак відзначити, що "Пам'ять Америки" свідчить лише про високий рівень розвитку інформаційних технологій в Америці. Значних же колекцій пам'яток писемності та друку, що становили б особливу цінність для світової культури, це історичне зібрання не має. В ньому переважають електронні копії фотографій визначних діячів США, архітектурних споруд тощо. Це зібрання являє собою de-facto електронний музей, де зберігається культурна спадщина США. "Пам'ять Америки" існує і розвивається на кошти, що виділяються Конгресом США і чисельними спонсорами. Серед них фірми IBM, Hewlett-Pakkard, AT&T, Bell, Kodak. Загальна вартість програми "Пам'ять Америки" — 60 млн. долларів, з них 75% — спонсорські кошти.

Роботи в напрямі створення електронних інформаційних сховищ проводяться і в ряді інших країн. У 1993 р. Архіви Австралії, Австралійська рада бібліотек і інформаційних служб, Національне агентство по збереженню документів і Національний архів звуку та кіно створили робочий орган для розробки рекомендацій по опрацюванню електронних матеріалів. Ці роботи проводяться в рамках більш загальної програми "Назустріч Федерації 2001" (у 2001 р. відзначатиметься сторіччя Австралійської Федерації). У своїй діяльності фахівці Австралії опираються на досягнення американських колег. Вони, зокрема, активно використовують матеріали "Робочої групи по архівації електронної інформації" США (вказану групу організували Комісія по збереженню і доступності документів США і Група наукових бібліотек) [8].

У Китайській Народній Республіці до програми створення цифрових бібліотек приступили в 1997 р. [9]. Початковий етап реалізації програми, завершення якого передбачається в грудні 1999 р., включає дві частини. Перша — орієнтована на створення технології підготовки електронних інформаційних ресурсів, що враховуватиме мовні особливості Китаю і відповідатиме міжнародним стандартам, а друга — на інтеграцію і систематизацію інформації в розподілених цифрових бібліотеках.

Значна кількість проектів створення електронних бібліотек (як національного, так і міжнародного рівнів) існує і в Європі. Найбільш відомим з них є "Bibliotheca Universalis", що ставить за мету створення глобальної мережі електронних бібліотек [8, 10]. Цей проект започаткований у 1995 р. і є одним з 11 науково-технічних проектів, які реалізується під егідою країн "Великої сімки". Основна мета проекту визначається як забезпечення загальнодоступності наукової та культурної спадщини людства шляхом використання мультимедійних технологій і глобальних комп'ютерних мереж. При цьому ключовим концептуальним положенням проекту "Bibliotheca Universalis" є міжнародна кооперація провідних бібліотек країн "Великої сімки". Це положення було закріплено в офіційній угоді, підписаній учасниками проекту в серпні 1998 р. під час 64-ї Генеральної конференції Міжнародної федерації бібліотечних асоціацій і організацій (ІФЛА) в Амстердамі. Однак доводиться констатувати, що в рамках цього проекту, як і американського проекту "Ініціатива цифрових бібліотек", поки що не досягнуто вагомих результатів через невирішенність проблеми авторського права.

Слід відзначити підвищену увагу ІФЛА до розв'язання вказаної проблеми. На 62-й Генеральній конференції цієї федерації, що відбулася в Пекіні 25-31 серпня 1996 р., було прийнято Заяву, яка відбиває офіційну позицію ІФЛА з питань авторського права в електронному середовищі [11]. В ній зазначено, що користувачам бібліотек мають бути надані такі можливості:

У Заяві відзначається також, що "виготовлення бібліотекарями електронних копій матеріалів, захищених авторським правом і їх тимчасове зберігання в системі електронної доставки документів не слід вважати порушенням авторських прав". Особливо потрібно наголосити на тому, що "ІФЛА вважає необхідним законодавче закріплення за бібліотеками та архівами можливості переводу в машиночитану форму захищених авторським правом текстів і зображень з метою забезпечення їх збереження і консервації. Потрібне також законодавче закріплення практики надання обов'язкового примірника електронних документів". І, насамкінець, к Заяві говориться, що "ІФЛА вважає необхідним для забезпечення вільного обміну інформацією прийняти міжнародні угоди, що регулювали б передачу інтелектуальної власності через національні кордони. Подібні угоди мають сприяти досягненню рівноваги між здійсненням технічного контролю і забезпеченням доступності інформації для легітимних користувачів".

Однак, офіційна позиція ІФЛА, що є авторитетною міжнародною організацією, поки що не знайшла законодавчої підтримки в національних нормативних актах. Не є виключенням і наша держава. У нещодавно прийнятому Законі України "Про обов'язковий примірник документів" [12] передача визначеному колу бібліотек з видавництв комп'ютерних версій друкованих видань для формування на цій основі національних депозитаріїв не передбачається, хоч у процесі підготовки цього Закону подавалися відповідні пропозиції до профільних комісій Верховної Ради України.

Електронні бібліотеки Росії

В аспекті практичної реалізації ідеї створення цифрових бібліотек певного прогресу досягнуто в Росії, де, з однієї сторони, має місце досить "ліберальний" підхід до проблеми авторського права, а, з другої, — зацікавленність багатьох авторів довести свою інтелектуальну продукцію до світової спільноти засобами глобальних комп'ютерних мереж.

Найбільш відомою і однією з найкрупніших електронних бібліотек Росії й світу є "Бібліотека Максима Мошкова" [13]. Вона створена 1994 року на аматорських засадах і нараховує сьогодні понад 10 тис. текстів. Уявлення про них можна отримати з переліку розділів цієї бібліотеки:

Наведений перелік розділів бібліотеки свідчить, з одного боку, що в її створенні не приймали участі фахівці бібліотечної справи (у розділ "Детективи", наприклад, включено нормативні акти), а, з іншого, — про можливість створення значних зібрань електронних документів навіть в умовах економічних негараздів сьогодення.

Не менш відомою є й електронна бібліотека "Московская коллекция рефератов", формування фонду якої було розпочато в березні 1994 р. [14]. Інформаційний ресурс цієї електронної бібліотеки — близько 5 тис. студентських курсових і дипломних робіт. Всі матеріали з колекції отримуються безкоштовно. Поповнення бібліотеки здійснюється студентською спільнотою країн СНД (переважно, Росії й України). Кожний реферат містить крім самої роботи, що зберігається у вигляді заархівованого файлу, містить інформаційну довідку в якій наведені: назва роботи та її анотація, ім'я автора та викладача, під керівництвом якого вона була виконана, найменування навчального закладу, отримана оцінка. Фонд цієї колекції структурована за навчальними дисциплінами (фізика, хімія, історія, економіка тощо), загальна кількість яких досягає 50. Про популярність "Московской коллекции рефератов" свідчить наявність кількох серверів-дзеркал, на яких підтримуються її інформаційні ресурси.

Серед російських електронних бібліотек слід відзначити "Публічну електронну бібліотеку Євгена Пескіна" (створена 1992 року, нараховує біля 1 тис. творів класиків російської літератури) [15] і бібліотеку "Російська фантастика" (створена 1996 року, нараховує понад 1,5 тис. книг 280 авторів) [16].

Особливо слід зупинитися на "Національній електронній бібліотеці" (НЕБ) Росії [17]. Вона являє собою найбільший у світі електронний архів російськомовних документів — матеріалів російських газет, журналів, радіо- і телестанцій, а також інформаційнино-аналітичних агенцій. Успіх проекту створення цієї бібліотеки пояснюється тим, що він зародився у 1994 р. як проект Національної служби новин Росії і проблема авторського права розв'язувалася в рамках єдиного інформаційного об'єднання. Доцільно більш детально розглянути ряд аспектів функціонування цієї бібліотеки.

В архіві НЕБ представлені російськомовні документи засобів масової інформації практично з усіх регіонів Росії, країн СНД, Балтії та далекого зарубіжжя. Єдиний пошуковий простір об'єднує понад 3,5 млн. документів. Щодня НЕБ обробляє біля 4,5 тис. нових документів. У повнотекстовій формі інформація на регулярній основі поступає від 290 редакцій засобів масової інформації. Матеріали майже 50 провідних газет і журналів потрапляють до фондів бібліотеки ще до появи їх друкованого варіанту, а повідомлення інформаційних агенств — у режимі реального часу. Всього ж перелік постачальників НЕБ включає більш 2 тис. інформаційних джерел.

НЕБ реалізує промислову технологію отримання, обробки, накопичення і зберігання інформації. Технологічне забезпечення дозволяє поповнювати архів і підтримувати доступ до нього безперервно в цілодобовому режимі. Частина видань поступають у вигляді електронних повідомлень по мережі Internet. Джерела інформації, що не мають електронної версії, скануються з паперових носіїв з використанням новітніх програмно-технічних засобів і технологій. Технологія сканування дозволяє обробляє до 6 тис. газетних шпальт за добу.

Доступ до бібліотеки можливий з будь-якого регіону світу по каналах глобальних комп'ютерних мереж. При цьому забезпечується довільний пошук інформації у повних текстах документів з використанням ключових слів, словників-порадників і семантичних та синтаксичних зв'язків між пошуковими термінами.

НЕБ використовує сучасну програмно-технічну базу. В якості технологічних засобів, які забезпечують роботу з фондами, обрано систему повнотекстового пошуку у великих інформаційних масивах за ключовими словами (Textract виробництва фірми MR Memex Co Ltd). Це програмне забезпечення було розроблено з орієнтацією на аналітичні системи, які використовуються в правозахисних органах США, Європи та Австралії. Серед них Федеральне бюро розслідувань, Центральне розвідувальне управління, FinCen, поліція Скотланд-Ярду, поліція Австралії. Раніше згаданий програмний продукт мав статус закритої розробки, на початку ж 90-х років його розсекретили і почали використовувати в комерційних цілях. НЕБ придбала єдину в Росії версію Textract і силами своїх фахівців провела його адаптацію як для роботи з російськомовними текстами, так і для використання в якості системи пошуку з Web-інтерфейсом.

Для роботи в Internet НЕБ використовує цифровий канал з пропускною спроможністю до 10 Мбіт/сек. Користувачам надається також можливість підключення у режимі dial-up IP (сеансове підключення) по комутуємих телефонних лініях і по виділеному цифровому каналу.

Безкоштовно НЕБ надає користувачам такі щоденні типові інформаційні продукти: Банки та банківська діяльність, Відставки/Призначення, Mass-media, Рейтинги НЕБ, Огляд центральної преси, Огляд регіональної преси, Огляд зарубіжної преси, Огляд "Теми дня". Загальнодоступним сервісом бібліотеки є також ретроспективні тематичні дайджести та підбірки (Преса про імпічмент президента, листопад 1998 р.; Іракська криза: коментарі та оцінки, грудень 1998 р. тощо).

Основна ж інформація надається кінцевим користувачам НЕБ на комерційних умовах. При цьому бібліотека виступає в ролі посередника між цими користувачами і постачальниками інформації (редакціями газет, журналів, інформаційних агентств, теле- і радіокомпаній, аналітичними центрами та інститутами). Вказані постачальники самостійно визначають вартість своїх матеріалів, НЕБ лише збільшує її на суму своїх послуг. Це стало можливим завдяки унікальній розрахунково-біллінговій системі, що діє в бібліотеці. Крім організації розрахунків з користувачами і постачальними інформації, ця система дозволяє видавництвам оперативно регулювати свою цінову політику на основі статистики запитів на конкретні документи.

В цілому ж викладене ілюструє можливість вирішення проблеми авторського права в рамках певної системи інформаційних комунікацій шляхом економічної зацікавленності всіх її суб'єктів навіть без прийняття додаткових нормативних актів.

Заслуговує на висвітлення світовий досвід представлення в Internet електронних версій наукових журналів. За даними [18] в глобальних комп'ютерних мережах їх налічується понад 9,6 тис., у тому числі 5,2 тис. — з природничих та прикладних наук, 3,1 тис. — з соціальних, і 1,3 тис. — з гуманітарних наук і мистецтва. Власниками інформаційних ресурсів у більшості випадків є великі видавництва, серед яких такі партнери бібліотек як Ebsco, Elsevier Science, Springer, Swets & Zeitlinger. В них впроваджена технологія підготовки журналів, що первісно орієнтована не лише на отримання друкованого видання, а й представлення його електронної версії в Internet у одному з стандартних форматів, про які буде більш детально розглянуто нижче (при відсутності такої орієнтації трудовитрати на отримання електронних версій видань суттєво збільшуються). Слід відзначити, що доступ до більшості електронних журналів потребує підписки. Приємним виключенням є періодичні видання з бібліотечної справи та суміжних галузей. Їх налічується кілька десятків і майже всі вони є загальнодоступними.

Інформаційно-ресурсні компоненти електронних бібліотек

У загальному випадку електронна бібліотека має три інформаційно-ресурсні компоненти [19], що функціонально орієнтовані на розкриття власних фондів, пошук у світовому документному інформаційному потоці і отримання повних текстів документів.

Розкриття власних фондів бібліотеки забезпечує електронний каталог поточних надходжень, а також банк даних з ретроспективною національною бібліографією. Книгозбірні з незначним обсягом фондів можуть провести повну ретроспективну каталогізацію, але для великих бібліотек таке завдання сьогодні вбачається нереальним (його розв'язання потребуватиме спеціальної державної програми). Електронні каталоги, картотеки та бази даних ретроспективної національної бібліографії створюються бібліотеками самостійно або в кооперації з іншими книгозбірнями. Тому авторські права на них належать самим бібліотекам і вони можуть поширювати їх без будь-яких обмежень (представляти в Internet, записувати на оптичні диски для передачі іншим організаціям тощо).

Для пошуку в світовому документному інформаційному потоці бібліотеки повинні підтримувати комплекс бібліографічних, реферативних, фактографічних і оглядово-аналітичних баз даних на компакт-дисках, що випускаються в розвинених країнах, доповнивши його тематичними базами даних, які формуватимуться українськими бібліотеками. З широкого спектру наявних інформаційних ресурсів на компакт-дисках слід придбати, насамперед, бази даних національних бібліографій інших держав та копії електронних каталогів їхніх провідних бібліотек. Доцільним вбачається і комплектування електронних бібліотек продукцією інформаційних центрів, зокрема, багатогалузевими базами даних "Science Citation Index" Інституту наукової інформації США і тематичними базами даних ВІНІТІ (Росія). Ця складова інформаційних ресурсів електронних бібліотек створюється книгозбірнями як самостійно, так і з залученням продукції інших центрів-генераторів інформації. Авторські права цих центрів мають бути враховувані при використанні їх продукції в бібліотеці. Так, книгозбірня не може без відповідного дозволу представляти інформаційні ресурси інших організацій в Internet або тиражувати їх шляхом перезапису на оптичні диски.

Отримання повних текстів документів забезпечуватиметься інформаційними ресурсами депозитарію електронних документів, де зберігатимуться комп'ютерні версії книг, журналів і газет, які видаються в Україні чи вільно поширюються в Internet, а також власна інформаційна продукція українських бібліотек. У перспективі в названому депозитарії мають відбиватися всі поточні видання України, що становитимуть ядро фонду електронної бібліотеки. Внесок же самих книгозбірень у цю складову інформаційно-бібліотечних ресурсів полягатиме, насамперед, у створенні на компакт-дисках копій ретроспективних фондів, інформаційна й історико-культурних цінність яких не підвладна часу. Їх поширення будь-якими засобами може здійснюватися книгозбірнями без обмежень. Багатоаспектне ж використання електронних версій поточних видань згідно чинним нормативним актам має бути узгоджено з їх авторами.

Форматне забезпечення електронних бібліотек

Формати бібліографічних і реферативних записів однозначно визначаються рядом взаємопов'язаних державних і міжнародних стандартів [20-24]. Їх дотримання вважається обов'язковим і при підтримці каталогів та картотек на паперових носіях. Однак відхилення від цих стандартів позначається лише на якості довідково-бібліографічного апарату традиційної книгозбірні. Електронні ж бібліотеки без чіткого дотримання стандартів взагалі не можуть стати складовими елементами світового інформаційного простору.

Основний формат електронних текстів — HTML (Hyper Text Markup Language — мова маркірування гіпертекстів) [25]. Документ у форматі HTML включає набір спеціальних команд, що дають змогу переглядати текстові матеріали, відбивати графічну інформацію, прослуховувати звукові файли, відправляти електронну пошту, переходити на інші сторінки тощо. Створення HTML-документів здійснюється за допомогою будь-якого текстового редактора чи з використанням спеціалізованих HTML-редакторів. Для перегляду документів у цьому форматі розроблено широкий спектр програм-броузерів, найбільш поширеними з яких є Netscape Navigator та Microsoft Internet Explorer.

Документи, котрі потребують при відтворенні повного збереження абеткового й графічного оформлення (наприклад, рукописи), слід подавати в форматі PDF (Portable Doсument Format — формат документів, що переноситься) [26]. Програма для читання PDF-документів Adobe Acrobat Reader поширюється безкоштовно, але повний набір програм для їх створення коштує понад 6 тис. гривень. PDF-формат у глобальних комп'ютерних мережах є стандартом de facto.

В цілому ж слід констатувати, що форматне забезпечення електронних бібліотек має задовільну нормативну базу.

Лінгвістичне забезпечення електронних бібліотек

Книгозбірні України при тематичному пошуку використовують три версії Бібліотечно-бібліографічної класифікації (для універсальних, обласних і масових бібліотек), Універсальну десяткову класифікацію, предметні рубрики та галузеві тезауруси. Для забезпечення спадковості електронних і традиційних пошукових засобів бібліотеки будуть вимушені підтримувати їх певний час і надалі, оскільки перехід на єдину для всіх українських книгозбірень систему індексування документів сьогодні не вбачається можливим (це потребувало б значних фінансових і трудових ресурсів та часу).

Тому в основу розробки лінгвістичного забезпечення електронних бібліотек необхідно покласти принцип інваріантності до системи індексування документів у конкретній книгозбірні. Один з підходів до практичної реалізації цього принципу — створення і включення до складу лінгвістичних засобів електронних бібліотек комплексу баз даних з інформацією про згадувані вже класифікаційні схеми [19]. Формат записів у цих базах даних повинен мати структуру "класифікаційний індекс — словесне визначення — супутні терміни", а пошукові засоби підтримувати навігацію за ієрархією індексів. Другий напрям передбачає використання розвинених засобів морфологічного аналізу та граматичної нормалізації лексики, які дають змогу формулювати пошукові запити мовою, наближеною до природної. Такі засоби розроблені і впроваджені в інформаційно-пошуковій системі "Артефакт" фірми "Интегрум-техно" і в розробках фірм "Agama", "Медиа Лингва" та "CompTek International", що встановлені на російських пошукових серверах Internet "Апорт!", "Следопыт" і "Яndex" [19]. Цей напрям орієнтований на реалізацію пошуку по всьому тексту документа. Безперечно доцільним є використання досвіду російських колег у розробці алгоритмів морфологічного аналізу та граматичної нормалізації лексики, однак механічне копіювання цього досвіду без врахування особливостей української мови не вбачається можливим.

Обов'язковий елемент лінгвістичного забезпечення електронних бібліотек — файли авторитетних даних, які враховують розбіжності в наведенні заголовків бібліографічних записів (імен авторів, найменувань колективів, назв серіальних видань, уніфікованих назв класичних анонімних творів, предметних рубрик тощо).

В ряді випадків перспективним вбачається використання фасетних класифікацій, що включають хронологічний, географічний і тематичний фасети, а також фасет персоналій [27].

Загалом же cлід констатувати недостатню розробленість проблеми лінгвістичного забезпечення електронної бібліотеки і необхідність залучення до її розв'язання мовознавців, бібліотеко- й бібліографознавців та спеціалістів у галузі інформатики.

Програмне забезпечення електронних бібліотек

Програмні засоби для формування і використання електронних бібліотечно-інформаційних ресурсів у нашій державі доцільно розробити спільними зусиллями українських книгозбірень з можливим залученням профільних зацікавлених організацій. Таке рішення випливає з аналізу ходу робіт з автоматизації бібліотечно-бібліографічних процесів в Україні й СНД. Бібліотеки, що апробували західні програмні системи Liber (Франція), Tinlib (Великобританія), VTLS (США), через якиийсь час відмовилися від них через недостатнє врахування особливостей вітчизняної бібліотечної технології і перейшли на розробки російських фахівців (ИРБИС або МАРК). До цього слід додати, що не можна вважати успішним і розрекламоване впровадження системи Aleph (Ізраїль) у кількох книгозбірнях країн Центральної Європи, оскільки з цієї системи здебільшого використовується тільки пошуковий модуль OPAC, автоматизація ж процесів комплектування та каталогізації забезпечується іншими пакетами прикладних програм, зокрема, поширеною в СНД системою CDS/ISIS (UNESCO).

Шляхом розробки "власного" програмного забезпечення йдуть сьогодні російські бібліотеки. Вони спрямували основні зусилля на розвиток вищезгаданих пакетів прикладних програм CDS/ISIS-ИРБИС і МАРК, які мають функціонувати під управлінням операційних систем з графічним інтерфейсом і бути сумісними на рівні мережевих технологій.

При розробці вітчизняних програмних засобів для електронних бібліотек слід, безперечно, враховувати позитивні риси Aleph, Liber та інших систем. Однак, розраховувати на успіх такої роботи можна лише в тому випадку, коли вона буде зорієнтована на інформаційні технології XXI сторіччя: Intranet (реалізація Web-технологій безпосередньо в бібліотеці), OLE (Objekt Linking and Embedding — зв'язування і впровадження об'єктів) тощо.

Вбачається доцільним використати при створенні вказаних програмних засобів нову двохкомпонентну схему, що матиме дві групи пакетів прикладних програм, орієнтованих відповідно на автоматизацію внутрішніх технологічних процесів у книгозбірні і підтримку Internet-технологій [19]. Перша група не передбачає підтримки баз даних великої ємності (вони зберігатимуться на Internet-серверах бібліотек), забезпечення високої швидкості під час обробки даних (більшість технологічних операцій комплектування та каталогізації мають клавіатурний характер), інтелектуальності лінгвістичних засобів (у службових базах даних пошук записів здійснюється як правило не за семантичними, а за ідентифікаційними ознаками). Завдяки цьому розробка даної компоненти програмного забезпечення не потребує використання потужних і відповідно коштовних систем керування базами даних типу Oracle. Вона може здійснюватися на простих системах, поширюваних безкоштовно, у напрямку створення гнучкого програмного пакету, що легко адаптуватиметься до специфіки конкретної української книгозбірні. Необхідні ж вихідні параметри електронної бібліотеки в цілому будуть досягнуті іншою компонентою прикладного програмного забезпечення, що призначена для підтримки Internet-технологій. При створенні цієї складової програмного забезпечення доцільно використати одну з апробованих постреляційних систем керування базами даних.

Для забезпечення інформаційної безпеки України принципово важливо врахувати вимоги ліцензійної чистоти програмного забезпечення електронних бібліотек.

Технологія формування інформаційних ресурсів електронних бібліотек

Створення електронних бібліотечно-інформаційних ресурсів здійснюється на основі наявних у суспільстві документних потоків шляхом їх обробки та архівації для забезпечення наступного багатоаспектного використання. При цьому бібліотеки виступають не лише в ролі сховищ документованих знань, а й генераторів нової синтезованої інформації. Як при кумуляції наявних документних потоків, так і при підготовці нової інформаційної продукції книгозбірні використовують:

Технологія клавіатурного вводу інформації використовується при створенні записів у бібліографічних, реферативних та фактографічних базах даних книгозбірень. У НБУВ, наприклад, клавіатурним шляхом наповнюється електронний каталог поточних надходжень, бази даних "Реферати наукових видань України" та "Ретроспективна національна бібліографія України", службові картотеки підрозділів книгозбірні. Сьогодні це основні власні електронні інформаційні продукти НБУВ.

Створення електронних версій документів, що вже існують на паперових носіях, здійснюється шляхом скануванням першоджерел з наступним конвертуванням отриманого файла у файл зі структурою вищезгаданих форматів HTML або PDF. Слід відзначити, що у зв'язку з обмеженнями, які випливають з авторського права, цей процес застосовується, в основному, для створення електронних версій ретроспективних фондів з непересічною інформаційною та історико-культурною значимістю. Для отримання документу в HTML-форматі необхідне розпізнавання відсканованого файлу. Цей процес потребує, як правило, участі оператора, який здійснює перевірку і коригування результатів розпізнавання. Конвертування в PDF-формат може проводитися в повністю автоматичному режимі без участі людини, тобто цей формат потребує менше трудовитрат на отримання електронної версії оригіналу. Однак обсяг документа в форматі PDF в 3-5 разів більший (у kB) порівняно з обсягом цього ж документа в форматі HTML. Тому у світовій практиці формат PDF використовується для створення електронних версій наукових видань зі значною кількістю формул, графіків тощо. Для відбиття текстових матеріалів (наприклад, художньої літератури, котра практично не має ілюстрацій) застосовується формат HTML.

Сьогодні всі нові видання готуються з використанням комп'ютерних засобів. Файл-верстки цих видань існують ще до отримання друкованих примірників. Безперечно доцільно взяти ці файли за основу при формуванні електронних бібліотечно-інформаційних ресурсів. Однак, якщо файл-верстки первісно не були орієнтовані на конвертування у вищезгадані формати, більш ефективною може виявитися технологія зі скануванням вже надрукованих видань. Світовий досвід свідчить, що значні сховища електронних інформаційних ресурсів створювалися там, де вже в процесі підготовки видань до друку передбачалася їх наступна архівація і використання в комп'ютерних мережах. Як приклад можна навести російську "Національну електронну бібліотеку" [17]. На одній з її Web-сторінок спеціально наведені вимоги до матеріалів для включення в фонд бібліотеки. Вони складаються з трьох розділів: "Специфікація даних для інформаційних агенств", "Специфікація даних для періодичних видань" і "Вимоги до відправки файлів з документами електронною поштою". Два перші розділи включають вимоги до кодування символів, представлення тексту (відзначається неприпустимість переносів, форматування, використання псевдографіки та інших нетекстових символів), довжини рядків тощо. В них наводяться також обов'язкові поля-заголовки. Для періодичних видань, зокрема, мають бути вказані:

У "Вимогах до відправки файлів з документами електронною поштою" відзначається, що обробка поштових повідомлень проводиться програмою, а не людиною. Тому повідомлення, що не відповідають вимогам, автоматично вилучатимуться. У цьому розділі до відома постачальників інформації доводиться, що кожний документ повинен надсилатися окремим файлом, який може бути оброблений одним з визначених програм-архіваторів, а в полі листа "Subject" назва періодичного видання повинна наводитися латинською транскрипцією.

В Україні роботи по формуванню елекронних бібліотек лише розпочинаються. Однієї з перших ініціатив у цьому напрямі став семінар з питань організації обміну електронними інформаційними ресурсами в системі бібліотек та інших науково-інформаційних підрозділів НАН України, проведений у квітні 1999 р. Інформаційно-бібліотечною радою НАН України. У роботі семінару взяли участь заступники директорів і завідувачі бібліотек науково-дослідних установ НАН України та провідні фахівці НБУВ. У вступному слові Генерального директора НБУВ академіка НАН України О.С.Онищенка, доповіді Голови Інформаційно-бібліотечної ради НАН України академіка НАН України В.В.Немошкаленка "Нові інформаційні технології і нові форми взаємодії бібліотек НАН України" та чисельних виступах при обговоренні доповіді було констатовано наявність в установах НАН України значної кількості електронних інформаційних ресурсів, належне взаємовикористання котрих сьогодні не здійснюється. Серед них електронні каталоги і картотеки НБУВ, бази даних праць співробітників науково-дослідних установ НАН України, електронні версії ряду цих праць, комп'ютерні файли-верстки журналів НАН України тощо. Обговоривши стан інформаційної складової розвитку науки і відзначивши певні позитивні зрушення у впровадженні новітніх інформаційних технологій, учасники семінару прийняли рішення, в якому доручили НБУВ організувати передачу в науково-дослідні установи НАН України копій електронного каталога і рекомендували цим установам організувати передачу до НБУВ своїх загальнодоступних електронних інформаційних ресурсів для створення електронної наукової бібліотеки НАН України.

Висновки і рекомендації
щодо формування в Україні електронних бібліотек

  1. Суперечність між невпинно зростаючим обсягом знань, які мають поширюватися в часі та просторі, і обмеженими можливостями існуючої системи документних комунікацій, що базується на паперових носіях інформації, обумовлює необхідність кардинальної активізації робіт по введенню в цю систему електронних бібліотечно-інформаційних ресурсів. При їх формуванні слід використати позитивні риси вітчизняної бібліотечної мережі, в якій більшість наукових книгозбірень є складовими елементами не лише системи соціальних комунікацій а й певних наукових об'єднань (Національної чи галузевих академій наук, ВУЗів тощо), завдяки чому ці книгозбірні мають передумови для створення електронних депозитаріїв наукових матеріалів організацій, до складу яких вони входять.

  2. Основна завада на шляху формування в бібліотеках фондів електронних версій друкованих видань — авторське право, точніше відсутність у законодавстві чіткого визначення прав книгозбірень щодо зберігання і надання читачам електронних версій друкованих видань в наукових, освітянських і культурологічних цілях (офіційна позиція ІФЛА з цього питання полягає в тому, що виготовлення книгозбірнями електронних копій матеріалів, захищених авторським правом, у згаданих цілях не слід вважати порушенням авторських прав).
    Для подолання цієї завади вбачається доцільним прийняття Національною та галузевими академіями наук України постанов про передачу комп'ютерних файлів-версток відомчих видань відповідним центральним бібліотекам для постійного зберігання і багатоаспектного використання. Кардинальним же вирішенням проблеми авторського права стало б внесення до чинного Закону України "Про обов'язковий примірник документів" доповнення про передачу видавництвами цифрових копій творів друку визначеному колу книгозбірень для депозитарного зберігання. Воно створило б передумови для того, щоб Україна стала одним зі світових лідерів у створенні електронних бібліотек.

  3. Для використання в електронних бібліотеках файлів-версток друкованих видань слід у існуючу комп'ютерну технологію підготовки матеріалів до друку додатково включити нові процеси, що забезпечили б подальше конвертування цих файлів у документи з структурою HTML- або PDF-формату (сьогодні часто сканування видання є більш ефективним шляхом створення його електронної копії).

  4. Необхідно відзначити вирішенність питань форматного забезпечення електронних бібліотек (формати однозначно визначаються міжнародними стандартами і рекомендаціями). В той же час слід вказати на недостатню розробленість проблеми лінгвістичного забезпення банків комп'ютерної інформації. Її розв'язання потребує залучення мово- та бібліотекознавців і спеціалістів у галузі інформатики, які мають створити засоби морфологічного аналізу та граматичної нормалізації лексики, що враховували б специфіку української мови і надавали змогу формулювати пошукові запити мовою, наближеною до природної.

  5. Наявні на комп'ютерному ринку України технічні засоби дозволяють вирішити питання архівації наявних інформаційних потоків і створення електронних копій документів, інформаційна й історико-культурна цінність яких не підвладна часу. Разом з тим необхідно констатувати відсутність в Україні фірм, що забезпечували б супроводження програмних систем для інформатизації бібліотек. З урахуванням аспектів інформаційної безпеки держави доцільно підтримати розробку відповідних вітчизняних систем і вирішити організаційні питання їх впровадження і розвитку.


Л І Т Е Р А Т У Р А

  1. Гениева Е.Ю. Виртуальная библиотека — символ открытого общества // Библиография.— 1996.— N 4.— С. 3-5.
  2. Столяров Ю.Н. Критика термина виртуальная библиотека // Науч. и техн. б-ки.— 1997.— N 8.
  3. Сукиасян Э.Р. Об уместности понятия "виртуальный СБА" // Науч. и техн. б-ки.— 1996.— N 11.— С. 14.
  4. Barker Ph. Electronic libraries — vision of the future // Electronic Library.— 1994.— Vol. 12.— N 4.— p. 221-230.
  5. Digital Library Initiative [Electronic Resource]. — Way of access: URL: http://www.dli2.nsf.gov/dlione/index.html. — Title from the screen.
  6. Digital Library Initiative [Electronic Resource]. — Way of access: URL: http://www.dli2.nsf.gov/. — Title from the screen.
  7. American Memory: Historical Collection for the National Digital Library [Electronic Resource]. — Way of access: URL: http://memory.loc.gov/ammem/amhome.html. — Title from the screen.
  8. Андреев В.А. Электронные библиотеки: опыт создания зарубежом // Науч. и техн. б-ки.— 1998.— N 2.— С. 8-11.
  9. Chinese Pilot Digital Library [Electronic Resource]. — Way of access: URL: http://www.nlc.gov.cn/dlib/dle1.htm. — Title from the screen.
  10. Bibliotheca Universalis [Electronic Resource]. — Way of access: URL: http://www.bl.uk/gabriel/bibliotheca-universalis/index.htm. — Title from the screen.
  11. Заявление, отражающее официальную позицию ИФЛА по вопросам авторского права в электронной среде [Электронный ресурс]. — Режим доступа: URL: http://cs.libfl.ru/koi/nzb96_3.html
  12. Про обов'язковий примірник документів: Закон України від 9 квітня 1999 р. N 595-XIV.
  13. Maksim Moshkow's Library [Электронный ресурс]. — Режим доступа: URL: http://lib.ru/. — Загл. с экрана.
  14. Referats: Украинское зеркало Московской коллекции рефератов [Электронный ресурс]. — Способ доступа: URL: http://www.referats.alkar.net/. — Загл. с экрана.
  15. Публичная электронная библиотека [Электронный ресурс]. — Режим доступа: URL: http://win.www.roline.ru/sp/rel/russian/. — Загл. с экрана.
  16. Русская фантастика [Электронный ресурс]. — Режим доступа: URL: http://kulichki.rambler.ru/sf/books/. — Загл. с экрана.
  17. Национальная электронная библиотека [Электрон. ресурс] Режим доступа: URL: http://www.nns.ru/. — Загл. с экрана.
  18. Чекмарьов А.О., Костенко Л.Й., Павлуша Т.П. Національна система електронних бібліотек. — К., 1998. — 50 с.
  19. ДСТУ 3578-97. Формат для обміну бібліографічними даними на магнітних носіях. — К.: Держстандарт України, 1997. — 20 с.
  20. ГОСТ 7.1-84. Библиографическое описание документа. Общие требования и правила составления. — М.: Изд-во стандартов, 1984. — 77 с.
  21. Руководство по UNIMARC: Руководство по применению международного коммуникативного формата UNIMARC / Пер. с англ. авт. коллектива под руководством А.И.Земскова, Я.Л.Шрайберга. — М., 1992. — 1320 с.
  22. UNIMARC/AUTHORITIES. Международный коммуникативный формат UNIMARC для авторитетных/нормативных записей: Пер. на рус. яз. — М., 1994. — 66 с.
  23. MARC for Archives and Manuscripts. The AMC Format by M.Sahli / SAA. — Chicago, 1985. — Updates 1987, 1992.
  24. Хеслоп Б., Бадник Л. HTML с самого начала / Пер. с англ. — СПб: Питер, 1997. — 416 с.
  25. Пайк М. Internet в подлиннике: Наиболее полное руководство: Пер. с англ. — СПб.: BHV-Санкт-Петербург, 1996. — 637 c.
  26. Павлуша І.А. Формування віртуальної бібліотеки пам'яток східнослов'янської писемності і українського друку // Вісн. Кн. палати. — 1998. — N 9. — С.13-15.

© Павлуша Ірина Анатоліївна, 1999
Національна бібліотека України імені В.І. Вернадського
www.nbuv.gov.ua