LOD Platform
Sistema tecnologico altamente innovativo, ed unico nel panorama di riferimento, per la strutturazione dei cataloghi bibliografici, organizzati secondo il data model BIBFRAME e la conversione dei dati in Linked Open Data.
Il sistema consente:
- la creazione di una struttura dati basata su registrazioni distinte per le entità Persone e Opere, come definito da BIBFRAME;
- l’arricchimento dei dati tramite uri di progetti esterni;
- la conversione dei dati, bibliografici e di authority, secondo il modello standard indicato dalW3C per i LOD, RDF – Resource Description Framework, mediante ontologie di settore selezionate tra quelle di riferimento nel contesto mondiale, integrate od estese;
- la pubblicazione del dataset in LOD su storage RDF (Triple Store);
- la costruzione di un portale di consultazione con interfaccia di navigazione basata su BIBFRAME: Persona/Opera, Pubblicazioni (Istanze) e Item
Componenti dell’architettura tecnologica
- AUTHIFY, modulo RESTFul che fornisce servizi di ricerca full-text di dataset esterni(scaricati, memorizzati ed indicizzati nel sistema), relativi soprattutto ad Authority file(VIAF, Library of Congress Name Authority file, …) ma estendibile anche ad altre tipologie di dataset. AUTHIFY è composto da due parti principali: un’infrastruttura SOLR per l’indicizzazione dei dataset e relativi servizi di ricerca, ed un livello logico che orchestra tali servizi per trovare una corrispondenza all’interno dei cluster delle Entità definite(tipicamente Nomi ed Opere)
- CLUSTER KNOWLEDGE BASE, su database PostgreSQL, è il risultato del processo di elaborazione e arricchimento dati con fonti esterne al catalogo bibliografico, per ognientità definita; tipicamente: cluster di nomi (forme, autorizzate e varianti, dei nomi delle Persone) e cluster di titoli (punti di accesso autorizzato e forme varianti per i titoli delle Opere)
- RDFizer, modulo Hadoop che automatizza l’intero processo di conversione e pubblicazione di dataset in formato RDF
- TRIPLE STORE, selezionabile tra quelli open source o proprietari, in base alle specifiche esigenze, per lo storage dei file RDF
- PORTAL SKIN, istanza di portale di pubblicazione dei dati
- JCRICKET Entity Editor, nuovo e innovativo tool per l’amministrazione collaborativa delle entità Linked Data e la catalogazione condivisa; un'applicazione che, sulla base dell’ontologia BIBFRAME, consente di gestire dati bibliografici sotto forma di entità Linked Data (creazione di nuove entità, loro modifica, applicazione delle funzioni di unione e divisione delle entità)