Шерепа Т.А. Концепція побудови пошукового апарату архіву мережевих ресурсів наукової бібліотеки // Документознавство. Бібліотекознавство. Інформаційна діяльність: Проблеми науки, освіти, практики: Зб. матеріалів IV Міжнар. наук.-практ. конф., Київ, 21-23 травня 2007 р. — К., 2007. — С. 194-196.


Концепція побудови пошукового апарату
архіву мережевих ресурсів наукової бібліотеки

Шерепа Тетяна Анатоліївна
Національна бібліотека України імені В.І. Вернадського, Київ

тетяна Шерепа
Інтенсивний розвиток глобальних комп'ютерних мереж обумовив появу ініціатив "самоархівування наукових публікацій" та створення електронних журналів відкритого доступу, найбільшими активними захисниками яких є бібліотеки. Стратегія самоархівування включає в себе розміщення авторами електронних версій своїх наукових публікацій у загальнодоступних архівах електронних документів, у вільному доступі в Інтернеті. Самоархівування дозволяє підвищити ефективність використання результатів наукових досліджень завдяки вільному доступу до наукових матеріалів. Публікації, що архівуються, повинні розташовуватися переважно в тематичних або інституційних репозиторіях (архівах). Під "архівом" розуміється сайт, що зберігає джерела наукової інформації у відкритому мережевому доступі. Другою стратегією є журнали відкритого доступу, які беруть на себе зобов'язання про вільний і відкритий доступ до матеріалів, які вони публікують.

Розміщення публікації на Web-сервері автора у вільному доступі не є бажаним для ідеї архівування наукових матеріалів, тому що звичайне Web-середовище не може забезпечити надійної ідентифікації метаданих та організації пошуку за ними, а також не є придатним для довготривалого збереження і гарантії незмінності публікацій. Суттєвою перевагою відкритих тематичних архівів електронних публікацій є здійснення попереднього збору та впорядкування документів спеціалістами. Наслідком є забезпечення фільтрації та пошуку даних з більш високим рівнем точності, тому що процес індексування таких систем є глибшим за його Інтернет-аналог.

З метою уніфікації представлення мережевих ресурсів розроблені єдині принципи їх опису, що базуються на використанні метаданих Дублінського ядра. Основною вимогою до репозитарію є підтримка протоколу OAI PMH (Open Archives Initiative Protocol for Metadata Harvesting), який забезпечує можливість збору структурованих метаданих про об'єкти, розміщених у репозитарії, об'єднання з іншими репозитаріями, й організацію пошуку в розподілених репозитаріях відкритого доступу.

Зважаючи на великі обсяги архівів електронних публікацій, проведення ручної класифікації та індексації кожного електронного документа не є можливим, тому як одиницю обліку фонду Інтернет-документів (Веб-ресурсів) зручно використовувати Веб-сайт чи його фрагмент. В рамках Веб-сайту є необхідність у проведенні автоматичного індексування, надаючи більше значення ваги індексаційним термінам, що є метаданими або заголовками електронних документів.

Викладені засади апробовано при побудові системи архівування науково-інформаційних ресурсів НБУВ, що передбачає збір і підготовку тематичних складових архіву електронних наукових публікацій та їх представлення в Інтранет-середовищі. Пошукова система Інтранет-архіву НБУВ реалізована на базі пакету прикладних програм CDS/ISIS з CGI- модулем WWWISIS, що забезпечує її однорідність з системою електронних колекцій бібліотек НБУВ.

Інформаційні ресурси Інтранет-архіву також можливо долучити до системи електронних видань на компакт дисках, програмні засоби якої також підтримують формат баз даних CDS/ISIS. Система електронних видань є комплексом галузевих серій колекцій документів. Галузеві серії формуються на основі структуризації наявних інформаційних ресурсів бібліотеки шляхом попереднього відбору документів з бібліографічних, реферативних, тематичних і повнотекстових баз даних, їх обробки та впорядкування.

Подальший розвиток пошукової системи архіву мережевих ресурсів наукової бібліотеки доцільно зорієнтувати в напрямках включення до його складу засобів класифікації й опису інформаційних колекцій документів та Веб-сайтів як одиниць зберігання, досягнення максимальної ресурсоощадності зберігання електронних колекцій, інтелектуалізації пошукового апарату, семантичного аналізу текстів і творення нових знань.


© Шерепа Тетяна Анатоліївна, 2007
Національна бібліотека України імені В.І. Вернадського
www.nbuv.gov.ua