Організація знань та довідкових ресурсів за стандартом SKOS

Українські музеї дедалі активніше починають працювати над оцифруванням своїх зібрань, ініціюють створення онлайн-ресурсів для презентації своїх колекцій тощо. Проте вкрай актуальною для України залишається проблема розрізненості таких ініціатив. Створені в їх межах музейні ресурси як правило є замкненими на собі та не відповідають сучасним стандартам інтероперабельності.

Це суттєво ускладнює об’єднання даних культурних інституцій на загальнонаціональному рівні, унеможливлює інтеграцію до міжнародних банків даних, не дозволяє повноцінно використати потенціал «цифри» для роботи з музейними колекціями та перетворити наявні дані на цінний ресурс для культурних креативних індустрій.

Подолання вказаних обмежень лежить у площині розвитку національної інфраструктури даних у сфері культурної спадщини, зокрема імплементації сучасних стандартів роботи з даними.

Важливою складовою такої інфраструктури мають стати спеціалізовані електронні тезауруси, довідники термінів, що визначають поняття, необхідні для опису, обліку та презентації музейних колекцій. Такі тезауруси мають стати спільними ресурсами для використання усіма зацікавленими сторонами. Відтак для їх побудови та презентації мають використовуватися спеціальні стандарти, аби забезпечувати єдині та універсальні методи їх формування та використання.

Сьогодні одним з ключових світових стандартів у цій сфері є SKOS – Simple Knowledge Organization System – Проста система організації знань. Він розробляється та підтримується Консорціумом всесвітнього павутиння (World Wide Web Consortium, W3C). W3C розробляє для Інтернету єдині принципи і стандарти, які потім впроваджуються виробниками програм і обладнання. Таким чином досягається сумісність між програмними продуктами та апаратними рішеннями різних компаній, що робить Всесвітню мережу більш досконалою, універсальною і зручною.

Стандарт SKOS визначає модель для представлення тезаурусів, схем класифікації, таксономій, систем заголовків предметів або будь-якого іншого типу структурованої контрольованої лексики. SKOS є частиною сімейства стандартів Семантичного Вебу (Semantic Web), побудованих на основі стандартів RDF та RDFS. Його основною метою є спрощення публікації та використання таких словників на засадах пов'язаних даних (Linked Data, LD).

Зокрема модель даних, описана стандартом SKOS визначає такі основні поняття як «тезаурус» (ConceptScheme), «поняття» (Concept), «переважна мітка» (PrefLabel), «альтерантивна мітка» (AltLabel) тощо. Вони є базовими для побудови структурованих систем знань. Відповідно до моделі поняття, пов’язані спільною темою можуть бути об’єднані в межах певного тезауруса. Кожне поняття – це абстрація, для позначення якої використовуються мітки (labels) – переважна та альтернативні. Кожна мітка може мати мовні версії – терміни, що традиційно використовуються для позначення поняття в різних мовах. В такий спосіб стандарт забезпечує формування розгалужених транснаціональних систем знань. Також для кожного поняття можна визначити чітко регламентовані семантичні зв’язки із іншими поняттями (синонім, уточнення, частина складної понятіної конструкції, ширше або вужче поняття тощо), як в межах поточного тезауруса, так і в інших системах знань.

Із повною специфікацією стандарту SKOS можна ознайомитись за посиланням https://www.w3.org/2009/08/skos-reference/skos.html

Найкращим прикладом спеціалізованих електронних довідників у сфері культурної спадщини є словники Фонду Гетті: AAT, TGN, ULAN та CONA (http://vocab.getty.edu/). Вони містять розгалужену структуровану термінологію для опису об’єктів мистецтва та загалом культурної спадщини. Матеріали довідників зокрема доступні за протоколом SPARQL як за власними спеціалізованими онтологічними моделями, так і за стнадратизованою схемою SKOS.

Публікація довідників Бібліотеки конгресу США також базується на принципах Linked Data (див.: https://id.loc.gov/). Зокрема, пропонується широкий спектр тезаурусів, класифікаторів та авторитених файлів у стандартах SKOS та MADS.

Першими в Україні спеціалізованими електронними тезаурусами для опису музейних предметів, що відповідають стандарту SKOS є довідники матеріалів та технік. Вони створені у 2018 р. за ініціативи ГО «Український центр розвитку музейної справи» та підтримки Українського культурного фонду. Вони є відкритими для спільного використання, зокрема, за допомогою відповідного програмного інтерфейсу.

Від початку роботи українського осередку міжнародного комітету СІDОС ми очікуємо, що члени цієї мережі візьмуть активну участь у розвитку цих тезаурусів та формуванні нових з метою ефективної публікації музейних колекцій на засадах LD.

Публікація даних на засадах LD, зокрема, із використанням спільних теазурусів за моделлю SKOS має цілу низку переваг. Насамперед, позитивним є мережевий ефект. Окремі набори даних, підготовлені розрізненими суб’єктами, доповнюють та збагачують один одного, коли стають елементами єдиної глобальної мережі. Також на цьому рівні дані мають дуже високий потенціал для автоматизованої обробки, вони набувають машиночитного семантичного значення, дозволяють повною мірою реалізувати потенціал цифрової обробки та презентації.