Шерепа Т.А. Інтерактивна технологія формування тематичних зібрань бібліотечних науково-інформаційних ресурсів / Т.А. Шерепа // Документознавство. Бібліотекознавство. Інформаційна діяльність: Проблеми науки, освіти, практики: Зб. матеріалів VIII Міжнар. наук.-практ. конф., Київ, 17-19 травня 2011 р. — К., 2011. — С. 190-192.


Шерепа Тетяна Анатоліївна
Національна бібліотека України імені В. І. Вернадського, Київ

Інтерактивна технологія формування тематичних зібрань
бібліотечних науково-інформаційних ресурсів

  Тетяна Шерепа
Посилення функцій бібліотек як суспільних інститутів поширення впорядкованих галузевих зібрань електронних видань призводить до активізації використання цих продуктів всією бібліотечною спільнотою. Впорядковані бібліотеками галузеві зібрання наукових інформаційних ресурсів за інформаційними потребами суспільства можуть бути поширені засобами комп'ютерних мереж та електронних носіїв інформації до науково-дослідних установ, навчальних закладів, виробничих структур в рамках повноважень загальнодержавної системи документорозповсюдження електронних документів, що базується на сформованих корпоративними зусиллями провідних бібліотек країни електронних ресурсах.

За допомогою уніфікованого програмного експертного інтерфейсу до масивів електронних документів бібліотеки отримують інструмент формування взаємодоповнюючого комплексу галузевих (тематичних) зібрань на основі структуризації наявних інформаційних ресурсів бібліотек, що має здійснюватися шляхом попереднього відбору документів з бібліографічних, реферативних, тематичних і повнотекстових баз даних, їх обробки та впорядкування, а також проведення автоматизованого аналізу семантично споріднених документів та застосування отриманих результатів з метою уточнення та розширення зібрань.

На сьогодні підходами до узгодження бібліографічних форматів для забезпечення сумісності мережевих і традиційних інформаційних ресурсів визначається сумісне використання основної класифікаційної схеми з її доповненням схемою, необхідною для автоматизованого використання. Ідея полягає у формалізації знань про різні предметні галузі, в такому форматі, щоб цим могли скористатися автоматичні програмні сервіси. Розвиток інформаційних технологій, що використовують бібліотечно-інформаційні бази даних, тісно пов'язаний з реалізацією принципів Семантичного вебу (Semantic Web): організації такого представлення даних, яке допускало б не лише їх візуалізацію але й ефективну автоматичну обробку на основі аналізу смислових (семантичних) зв'язків між об'єктами та поняттями.

Класифікація документів за традиційними бібліотечними схемами, проведена за участю бібліотечних працівників, а також спеціалістів предметних галузей, являє собою банк даних експертної бази знань і дає можливість автоматизації таких задач як класифікація, багатоаспектний пошук та інших актуальних задач обробки бібліотечних ресурсів. Експертне дослідження й бібліографічні описи великих масивів документів, що створені людиною-експертом, є статистично репрезентативною вибіркою, проводячи дослідження якої за допомогою використання методів здобуття знань Data Mining, можливе подальше автоматизоване проведення як конвертацій між різними стандартами й форматами, так і створення семантичних моделей, що можуть бути використані як для покращення обробки документів, так і для інтеграції з існуючими семантичними моделями предметних галузей, розроблених світовою спільнотою. Автоматизація обробки документних ресурсів істотно скорочує витрати часу на опрацювання документів висококваліфікованим спеціалістом-людиною.

Інтерактивна інформаційна технологія формування впорядкованих тематичних зібрань електронних ресурсів має за основну мету забезпечення інформаційних потреб кінцевих користувачів, і тому має бути гнучкою та надавати можливість підготовки спеціалізованих зібрань відповідно до користувацьких запитів.

Використовуючи дані семантичного аналізу колекції електронних документів в цілому, а також спираючись на класифіковану експертним шляхом вибірку документів, інформаційні технології обробки бібліотечних ресурсів здійснюють формування галузевих (тематичних) зібрань електронних ресурсів до запиту користувача за допомогою інтерактивного ітеративного програмного інтерфейсу, що на відміну від апарату стандартних класифікаційних схем дозволить побудувати навіть вузьке за тематикою зібрання.

Сформовані тематичні зібрання можуть слугувати допоміжними даними для розв'язку інших задач інтелектуалізації обробки бібліотечних ресурсів, а саме інтелектуалізації роботи пошукового апарату, автоматичної класифікації нових документів, виділення ключової мета-інформації документів, автореферування, використання ключової мета-інформації документів та тематичних зібрань з метою інтеграції та конвертації різних стандартів, класифікаційних схем та моделей концептуалізації даних.

Таким чином, подальший розвиток інтелектуалізації бібліотечних систем на базі виділення та дослідження основних понять та їх взаємозв'язків в текстах інформаційних ресурсів доцільно проводити в напрямку машинного навчання інформаційної системи обробки документів на основі банку знань тематичної класифікації документів, що створені людиною-експертом. Використання аналітичних технологій та методів поєднання людського інтелекту і комп'ютерних систем дозволяє знаходити нові знання, які користувачі можуть застосувати для поліпшення результатів своєї діяльності, а також сприяє подальшому ефективному використанні всього інтелектуального потенціалу суспільства.


© Шерепа Тетяна Анатоліївна, 2011
Національна бібліотека України імені В. І. Вернадського, Київ
www.nbuv.gov.ua