Базові рекомендації щодо оцифрування та публікації даних про об’єкти культурної спадщини

digitization

Рекомендації спрямовано на підвищення ефективності цифровізації культурної спадщини України, уможливлення об’єднання розрізнених, гетерогенних наборів даних в цілісну систему знань.


 

1. Оцифрування

Оцифрування об’єктів культурної спадщини доцільно здійснювати із дотриманням актуальних технічних стандартів та інструкцій.

Наприклад, в основу політики оцифрування нерухомих зображень матеріалів культурної спадщини може бути покладений документ Technical Guidelines for Digitizing Cultural Heritage Material (FADGI). Поточна, третя версія документу затверджена у травні 2023 року. Також на сайті FADGI опубліковані рекомендації і для інших типів матеріалів.

Іншим орієнтиром у розробці власної політики оцифрування та збереження зображень культурної спадщини можуть бути інструкції у межах програми Metamorfoze (2012).

 

2. Публікація оцифрованих матеріалів.

2.1. Ліцензування матеріалів

Оцифровані матеріали (дані та метадані) рекомендується публікувати за відкритими ліцензіями, наприклад Creative Commons, з метою забезпечення оптимального балансу захисту авторських прав та можливості безперешкодного спільного використання опублікованих матеріалів заради загальної суспільної користі.

 

2.2. Формат публікації

При публікації оцифрованих матеріалів надзвичайно важливим є вийти за межі формату, розрахованого виключно на людське сприйняття (публікація даних виключно через графічний користувацький інтерфейс) та забезпечити доступ до даних (метаданих) в структурованій машиночитній формі.

Рекомендованою є публікація структурованих машиночитних даних у відкритих (непропрієтарних) форматах, наприклад, csv, xml, json тощо.

Для підвищення ефективності спільного використання великого обсягу розрізнених даних про об’єкти культурної спадщини слід прагнути до їхньої публікації як зв’язаних даних (Linked Data / Linked Open Data) у форматі RDF (Resource Description Framework) із застосуванням стандартизованих протоколів (наприклад, SPARQL) та онтологій (також див. п. 2.3.).

Збереження та публікацію медіа файлів (фото, малюнків, планів, графічних матеріалів, відео) рекомендується здійснювати відповідно до специфікацій та інтерфейсів International Image Interoperability Framework (IIIF).

 

2.3. Семантична інтероперабельність

З метою забезпечення семантичної єдності та однозначної інтерпретації гетерогенних даних (метаданих) доцільним є використання:

- стандартизованих моделей даних (онтологій, схем метаданих тощо);

- уніфікованих тезаурусів (довідників, класифікаторів, авторитетних файлів тощо).

Зокрема, рекомендується забезпечувати формування та публікацію даних (метаданих) про об’єкти культурної спадщини відповідно до онтології CIDOC Conceptual Reference Model (ДСТУ ISO 21127), та/або із дотриманням національної схеми метаданих codeUA, міжнародної схеми метаданих LIDO тощо.

Для опису об’єктів культурної спадщини рекомендується використовувати уніфіковану термінологію, визначену за допомогою відповідних електронних тезаурусів (наприклад, словники Фонду Ґетті, україномовні тезауруси ProMuseum тощо).

У разі створення інституціями власних тезаурусів, рекомендується забезпечувати їх відкриту публікацію (зокрема, у форматі RDF) відповідно до моделі SKOS (можливе використання спільних платформ, наприклад, thesauri.pro або ін.).