Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

Appunti del corso Digital Humanities e patrimonio culturale, Appunti di Tecniche Artistiche

Sbobine del corso con schemi e immagini

Tipologia: Appunti

2020/2021
In offerta
30 Punti
Discount

Offerta a tempo limitato


Caricato il 31/10/2022

12elisa12
12elisa12 🇮🇹

4.5

(69)

20 documenti

1 / 26

Toggle sidebar
Discount

In offerta

Spesso scaricati insieme


Documenti correlati


Anteprima parziale del testo

Scarica Appunti del corso Digital Humanities e patrimonio culturale e più Appunti in PDF di Tecniche Artistiche solo su Docsity! DIGITAL HUMANITIES E PATRIMONIO CULTURALE – Francesca Tomasi Il corso intende avviare allo studio delle digital humanities. Analizzando le principali teorie, metodologie e tecniche di dominio, lo studente impara a progettare risorse umanistiche digitali. Lo studio, in particolare, degli standard archivistici, bibliografici e museali, permette allo studente di apprendere, alla fine del corso, come produrre, conservare e disseminare collezioni culturali digitali in sistemi integrati. Il corso intende avviare alle digital humanities, con un'attenzione speciale a linguaggi, modelli, strumenti e infrastrutture per la valorizzazione del patrimonio culturale: testi letterari, documenti d'archivio, materiale bibliografico e oggetti museali. Il corso sarà organizzato su 3 macro ambiti: 1. Analisi dei principali strumenti trasversali nelle DH: o Il funzionamento del WWW (protocollo, indirizzamento, linguaggi); o I linguaggi formali per la rappresentazione dei dati semi-strutturati (XML e schemi); o Il web semantico e i linked open data (Semantic Web Stack - URI, RDF e ontologie); o I sistemi di visualizzazione dai dati (HTML + CSS e principi di architettura dell'informazione); o La progettazione dell'interfaccia (elementi della pagina Web e sistemi di navigazione). Risorse online da consultare: • TEI - <http://www.tei-c.org>; <http://teibyexample.org/> • XML - <https://www.w3schools.com/xml/> • HTML, CSS, progettazione e interfaccia - <https://www.w3schools.com>; <https://www.codecademy.com/> • SEMANTIC WEB - <https://www.w3.org/standards/semanticweb/> • LINKED DATA - <http://linkeddata.org/> 2. Ricognizione delle attività di dominio delle DH, attraverso la disamina dei principali settori di ricerca in essere, ma con un'attenzione speciale a: o Digital scholarship e textual editing; o Digital libraries, archives and museums. In particolare, verranno analizzati progetti di settore per enucleare le caratteristiche specifiche del processo di costruzione di una risorsa digitale nel dominio delle DH. Risorse online da consultare: DH PROJECTS • Projects using the TEI: <http://www.tei-c.org/Activities/Projects/> • EADH projects: <http://eadh.org/projects> • Digital research tools: <https://dirtdirectory.org/> DH JOURNALS • Journal of DH - <http://journalofdigitalhumanities.org/> • DHQ - <http://www.digitalhumanities.org/dhq/> • DSH - <https://academic.oup.com/dsh> (accesso solo via proxy) • TEI journal - <https://journal.tei-c.org/journal/index> Uno STRUMENTO di riferimento generale: Paolo Monella, Digital Humanities Bibliography http://www1.unipa.it/paolo.monella/lincei/bibliography.html 3. Classificazione dei principali standard per la descrizione di risorse del patrimonio culturale, e delle ontologie derivate, in ambito di: o Disseminazione di risorse (Dublin Core); o Descrizione di testi letterari (TEI); o Descrizione archivistica (ISAD/EAD; ISAAR/EAC); o Descrizione bibliografia (ISBD, FRBR); o Gestione museale (LIDO, CIDOC-CRM); o Ambito trasversale (RAD, RIC-CM). Risorse da consultare online: • METADATA for ALL: <http://firstmonday.org/ojs/index.php/fm/article/view/1628/1543> • Jenn Riley, Seeing Standards: A Visualization of the Metadata Universe, copy 2009-10, http://jennriley.com/metadatamap/>. • W3C Incubator Group Report, Library Linked Data Incubator Group: Datasets, Value Vocabularies, and Metadata Element Sets. 25 October 2011, <https://www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset-20111025/>. Su LODLAM (Linked Open Data for Library, Archives and Museums): Mauro Guerrini, Tiziana Possemato, Linked data: un nuovo alfabeto del web semantico. JLIS.it. Vol. 4, n. 1 (Gennaio/January 2013) - <https://www.jlis.it/article/viewFile/6305/7892> Standard italiani di descrizione nel sistema MAB (Musei, Archivi, Biblioteche): • ICCU: <http://www.iccu.sbn.it/opencms/opencms/it/main/standard/> • ICCD: <http://www.iccd.beniculturali.it/index.php?it/473/standard-catalografici> • ANAI: <http://www.anai.org/anai-cms/cms.view?munu_str=0_1_3&numDoc=111> • ICOM: <http://icom.museum/professional-standards/standards-guidelines/> BIBLIOGRAFIA: Si consiglia di leggere prima dell'inizio delle lezioni, sono: • Francesca Tomasi, Metodologie informatiche e discipline umanistiche. Roma: Carocci, 2008. In particolare, i capp: 2, 4, 5, 8, 9. • A Companion to Digital Humanities, ed. Susan Schreibman, Ray Siemens, John Unsworth. Oxford: Blackwell, 2004. In particolare i capp. 1, 14, 16, 17, 22, 31. ESAME: La verifica dell'apprendimento si baserà su: 1. Progettazione di una risorsa digitale Web nel settore delle DH, con particolare riferimento alla descrizione di: - Modello architetturale (progettazione di interfaccia) e contenutistico (obiettivo della risorsa e tipo di dati); - Standard descrittivi scelti; - Modalità di accesso offerte (sistemi di navigazione e servizi). Il progetto dovrà essere sintetizzato in max 5 slide e presentato in massimo 10 minuti. 2. Realizzazione di un prototipo della risorsa Web progettata, che riusi tutte le tecnologie viste a lezione (linguaggi HTML5, CSS, XML, sistemi di controllo di autorità, standard per i beni culturali [almeno DC e TEI]), applicandole al caso pratico ideato in fase di progettazione. La presentazione della risorsa realizzata dovrà svolgersi in massimo 10 minuti. Le linee guida di progetto saranno pubblicate su IOL e messe a disposizione assieme al resto del materiale didattico. 3. Gli studenti non frequentanti sono tenuti, oltre a progettazione e realizzazione, anche alla discussione dei capitoli dei due manuali segnalati in bibliografia. È considerato frequentante lo studente che partecipa almeno al 75% delle lezioni. La valutazione sarà basata sui seguenti parametri: - Rispetto della tempistica (0-3 punti); - Adeguatezza della progettazione rispetto alle specifiche (0-9 punti); - Completezza dell'implementazione rispetto all'uso delle tecnologie (0-10 punti); - Correttezza nell'uso dei linguaggi formali (0-8 punti); - Proposta di soluzioni originali (per la lode). Un esempio pratico: gestire il ciclo vitale di un oggetto culturale Partendo da un progetto già fatto proviamo a decomporlo nei suoi elementi costitutivi per capire che metodo o modello è stato necessario usato rispetto all’intero ciclo vitale e le metodologie trasversali. Per capire la forma di un progetto già esistente dobbiamo: - Capire l’idea che sta dietro al progetto, l’idea di ricerca - Enucleare la serie di file che ci servono alla realizzazione di questo progetto (immagini, video, audio, testi…) - Conoscere le applicazioni o i programmi che servono per aprire o modificare questi file - Avere bisogno di ambienti dove manipolare, preservare e disseminare questi oggetti - Avere l’interfaccia utente  Modello Open Archival Information System (OAIS) (2002) un Sistema di gestione di informazioni in archivi (struttura di collezione dati) aperto. Ci deve essere qualcuno che produce un pacchetto informativo (SIP), che viene messo all’interno di un sistema di gestione (Ingest), che deve avere 2 sistemi: - Uno per preservare i dati (Archival Storage) - E uno per manipolare i dati (Data Management) Ogni dato comunque deve essere descritto Si crea così 2 pacchetti: - Un pacchetto di preservazione per il deposito permanente - E un pacchetto che conserviamo per l’accesso (DIP), che poi viene dato all’utente finale, il quale può ottenere delle informazioni dai dati ottenuti dal pacchetto. CASO: Vespasiano da Bisticci’s Letter A knowledge site (il nostro oggetto culturale) http://vespasianodabisticciletters.unibo.it Caso da cui partiamo al contrario per capire come è stato prodotto, come è stato descritto, come è stato archiviato, come è stato rappresentato, come è stato disseminato e come è stato fruito da un utente finale. Vediamo un’edizione digitale di una collezione di lettere del XV secolo, inviate e ricevute da Vespasiano da Bisticci, una sorta di imprenditore ante litteram, fu un capo di una scuola di copisti laici, che nella Firenze del XV secolo è stata la scuola che ha permesso alla letteratura latina ed ebraica di essere trasmessa alla posterità. Poi con l’avvento della stampa, Vespasiano si è ritirato all’Antella e lì è morto. L’idea dietro al progetto: è un knowledge site, un sito di conoscenza basato su tecnologie semantiche. L’idea è stata quella di raccogliere le lettere inviate e ricevute, per raccogliere la testimonianza di committenti che hanno richiesto delle copie di codici antichi alla scuola di Vespasiano, per riconoscere questi codici e per capire la tradizione della copia, della transizione commerciale dell’epoca. Si è editato questi strumenti, si sono annotati alcuni fenomeni che si è ritenuto più rilevanti (codici, persone, luoghi dati), annotare tutti i riferimenti al lessico della copia, tutti i nomi dei testi e dei codici menzionati, e citazioni classiche. Cosa è stato fatto 1. Recupero di tutte le lettere (da fonti materiali), acquisite digitalmente e descritte dal punto di vista degli standard per ogni tipologia documentaria 2. Trascrivo, marco e annoto il contenuto. Aggiungo un commento come forma di annotazione finalizzata all’ulteriore arricchimento del contenuto. 3. Creo come servizi strumenti vari di accesso (per persona, data, segnatura, indici degli autori classici menzionati, linea del tempo, mappa geografica…) 4. Infine, lo rendo fruibile attraverso un interfaccia web → uso tutti i dati descritti e acquisiti per creare la pagina HTML dentro la quale metterò come contenuti tutte queste cose, e le abbellisco con i CSS. 1. Manipolare i documenti – Raccogliere le fonti primarie A. La prima cosa da fare è raccogliere tutte le fonti primarie: andando in giro per biblioteche e archivi a cercare tutte le lettere di Vespasiano da Bisticci. B. Si raccolgono digitalmente ad una risoluzione adeguata rispetto alle normative vigenti (scannerizzando, fotografando…) C. Così si hanno dei file sul computer, che devono essere adeguatamente denominati = i nomi dei file sono importantissimi (no spazi ma si usa il trattino basso o alto come elemento separatore, il nome del file deve essere semanticamente auto esplicativo ci deve essere scritto tutto [istituto di conservazione, fondo, carta, recto/verso, pagina]) D. E poi vanno descritte: in questo caso abbiamo fonti diverse e quindi eterogenee su dal punto di vista della trasmissione materiale: Documenti d’archivio: documenti comunque diversi (alcune lettere autografe, altre no, altre originali, altre di Vespasiano altre no…) per descrivere queste fonti devo conoscere i principi della descrizione archivistica (che impongono di segnalare: il luogo, nome dell’istituto, nome del fondo, estremi cronologici, numero di pezzi, presenza di strumenti di corredo e l’indicazione della segnatura di ogni singola carta). Codici miscellanei: qui bisogna avere una descrizione del manoscritto (nome della città, istituto di conservazione, nome del fondo, estremi delle carte e modello di descrizione della tipologia documentaria). Codici di dedica: Anche qui altra tipologia documentaria dei manoscritti, ma in più i codici di dedica (essendo delle lettere pensate per essere donate ad un committente) quindi c’è un’attenzione in più per segnalare le pagine miniate e inchiostrate. 2. Trascrivere i documenti Dopo aver scelto le mie fonti passo alla trascrizione → vale a dire voglio rendere computabile anche il mio oggetto dotato di supporto materiale = metto la lettera sottoforma di testo → così che avrò: - Il file dell’immagine - Il file con i metadati descrittivi dell’immagine - Il file con il testo dell’immagine Allora devo: • Definire quali sono i tools che mi permettono di trascrivere= se fosse un testo contemporaneo potrei provare con OCR, ma nella scrittura manoscritta devo avere dei tools • Devo scegliere il linguaggio • Devo scegliere il formato di rappresentazione = in un caso come questo per rendere le trascrizioni fruibili sul web ad un utente finale, farò una trascrizione finalizzata alla conservazione e scambio (scelgo l’HTML, l’XML e la TEI)  scelgo il mio editor - noi usiamo Sublime Text – editor per scrivere in qualunque linguaggio di codifica (HTML-CSS-Java-TEI) • Passo alla trascrizione: - Prima cosa descriviamo la carta che cosa è, poi individuiamo i nomi i luoghi le date eccetera, - Facciamo alcune intuizioni, desumiamo alcune cose, faremo un’interpretazione del contenuto, - Infine facciamo la trascriviamo letteralmente. • Una volta acquisita la nostra trascrizione dobbiamo marcarla per annotare i fenomeni che siamo in grado di riconoscerli. XML/TEI mark-up ns:metadata + rdf files#XML:ID + string + ns:metadata ns:metadata Si trattano con ns: (namespace) → dichiarazione esplicita del tipo di vocabolario di annotazione che volevo usare, cioè la TEI. E l’elemento specifico di TEI che mi consente di esprimere quello che voglio dire → metadata rdf files#XML:ID Più ho deciso di arricchire con un secondo livello di interpretazione, creando un file esterno in rdf (quindi secondo tecnologie di carattere semantico) che mi consentisse su ogni fenomeno identificato univocamente nel mio file di partenza, di essere descritto # → frammento di una stringa di caratteri. Quindi quando la macchina vede # dopo si fa riferimento ad un contenuto che è una porzione di qualcosa che sta da qualche parte. string Questa porzione la associo ad una stinga di caratteri di un particolare ruolo ns:metadata E poi chiudo la dichiarazione del ns e la categoria concettuale. Quindi esempio: NB = la sintassi in HTML e CSS è sempre la stessa • Parentesi uncinata → < • Nome dell’elemento (della categoria concettuale) con o senza namespace per indentificare la funzione che svolge la stringa di caratteri a cui applico a quell’elemento • Spazio • Attributo → ref type • Uguale → = • Fra virgolette alte il nome dell’attributo → “people…” • Chiusa parentesi uncinata → > • Stringa di caratteri • Apri parentesi uncinata → < • Slash → / → che significa che questa categoria di appartenenza di questa stringa di caratteri è finita (cioè dopo Piero Strozzi qui finisce il nome di persona) • Solo il nome dell’elemento • Chiusa parentesi uncinata Elementi sintattici: < > = “ “ • Poi dobbiamo creare collegamenti fra dati Cosa ci aspettiamo poi di trovare in un file rdf → l’rdf è un modo per ragionare sui concetti rappresentandoli sottoforma di triple. La tripla è determinata dalla presenza di un soggetto e un oggetto collegati da un predicato (il verbo). Quindi quando noi dobbiamo dire qualcosa sui frammenti riconosciuti nel documento, non ragioniamo più per il documento nella sua interezza, ma si ragiona su sezione come persone, luoghi, dati… Ciascuno di essi deve essere identificato in modo univoco: con l’URI (Uniform Resource Identifier) che è un nome convenzionale in codice fiscale che mi permette di identificare univocamente ogni entità della mia base di conoscenza in modo univoco. Farò tutti collegamenti interni perché queste informazioni le ho acquisite all’interno del mio progetto. Cosa mi serve creare collegamenti? Non per farli vedere all’utente finale, ma solo a scopo computazionale. Quindi il principio a cui il web semantico ci porta è cercare il più possibile di valorizzare semanticamente i dati dei nostri progetti creando dei collegamenti con altri dati già esistenti in rete che possono arricchire l’esperienza dell’utente finale. • Ne consegue che la mia base di conoscenza e quindi il mio set di entità (persone, codici, lessico + relazioni) vengono arricchite recuperando informazioni già esistenti in rete che mi permettono di acquisire molte informazioni per ogni entità. Queste informazioni non le copio, non le porto nella mia base di conoscenza ma le collego attraverso gli URI. Attenzione però: io creo un collegamento con cose che non governo; perciò, se poi quel collegamento viene modificato con cose con cui non concordo è controproducente. Perciò si fa solamente per le cose oggettive: dati di natura biografica… Tutto ciò che è un approfondimento di libera interpretazione allora si arricchisce il file rdf così facendo che si possa arricchire la nostra base di conoscenza. Progetti, strumenti, piattaforme e ambienti per le DH… e per il MAB MAB = Musei, Archivi, Biblioteche Prima di avvicinarci ai linguaggi formali e capire come utilizzarli per rappresentare certe situazioni testuali, andiamo ad analizzare quello che è lo stato dell’arte su questi temi, per disporre già di esempi di progetti già realizzati. Progetti di DH: a quante cose è necessario pensare?! Per realizzare un progetto di DH è necessario porsi tutta una serie di questioni. Esempio di progetti che le raccontano: http://devdh.org/ Development for Digital Humanities Progetto di DH che racconta come dovrebbe essere un progetti di DH. Tabella su come realizzare un DH e i passi da seguire: 1. Scopri cosa sono le Digital Humanities 2. Idealizza il tuo progetto 3. Trova e prepara il tuo team e i tuoi partener: ovviamente per lavori grandi bisogna farlo 4. Individua i tuoi prodotti che potrebbero far parte del tuo progetto, individua che prodotto puoi realizzare 5. Gestisci i tempi e gli spazi del tuo progetto 6. Pensa ai dati 7. Fai campagna pubblicitaria 8. Stabilisci un budget 9. Pensa a strategie 10. Vedi come il tuo progetto viene valutato e risolvi i problemi se sta andando male 11. Quello che succede dopo? Quando il tuo progetto è terminato come si porta avanti? 12. Download http://dirtdirectory.org/ DIRT – Digital Research Tools Progetto online chiuso. Progetto di collezioni di risorse digitali per la ricerca. Era nato per cercare di raccogliere tutti i tools possibili immaginabili (anche i software) delle Digital Humanities organizzandoli per tipo di azione da svolgere: ➢ Es. tools per annotare, tools per creare un ambiente collaborativo, tools per pubblicare… Tutte le possibili azioni legate al ciclo di vita che potrebbe servire per creare un progetto di Digital Humanities. Questo poi si è evoluto in un altro progetto: http://tadirah.dariah.eu/vocab TaDiRAH - The Taxonomy of Digital Research Activities in the Humanities Pensato per cercare di stabilire il tipo di azioni necessari per la realizzazione di DH ma accompagnandolo anche capire quali sono le possibili azioni che posso svolgere e quali sono i possibili oggetti in cui riversare questo sforzo di strumenti rispetto al wordflow. Le azioni del wordflow sono affiancate alle tecniche e al tipo di oggetti che possono essere in qualche modo oggetti utili ai progetti delle DH. Adottando questo approccio tripartito tenta un po’ di creare una tassonomia di azioni e strumenti che è possibile utilizzare o svolgere nell’ambito delle DH. Repertori di Progetti: (utili per noi come riferimenti) • Digital Humanities Resources for Project Building: guides, tutorials, tools, examples, data collection & datasets http://dhresourcesforprojectbuilding.pbworks.com/w/page/69244243/FrontPage Classifica tutte le guide, gli strumenti, i tutoriali, i data e i dataset relativi alle DH. • EADH - https://eadh.org/projects → sito dell’associazione europea del DH, come raccolta di progetti online. • AIUCD - http://www.aiucd.it/progetti/ → sito dell’associazione per l’informatica umanistica e la cultura digitale, in cui c’è una sezione di progetti realizzati in Italia per il DH. Esistono anche dei cataloghi di sole edizioni digitali: • Catalogue of Digital Editions https://dig-ed-cat.eos.arz.oeaw.ac.at/ • A catalog of Digital Scholarly Editions https://www.digitale-edition.de/exist/apps/editions-browser/$app/index.html https://www.w3schools.com/ → sito che useremo per imparare html e css Quindi proviamo ad analizzare concretamente un progetto di DH In cosa consiste quindi un progetto di DH? Può essere un prodotto di vario tipo, classificato a seconda di varia terminologia: enciclopedie, edizioni, collezioni, repertori, strumenti, database, piattaforme, archivi, infrastrutture, cataloghi, aggregatori … Proveremo ad analizzarne alcuni tipi: • Archivi / collezioni / edizioni The Walt Whitman Archive - https://whitmanarchive.org/ Cosa: Uno dei primissimi progetti del settore. È la raccolta delle opere di Walt Whitman, è l’archivio della persona che colleziona tutta la produzione artistica e letteraria di uno studioso. Per chi: utile a tutti, studenti, lettori, insegnanti. Da dove: le risorse sono state prese da biblioteche e altre istituzioni culturali. Linguaggi formali: XML/TEI Possiede un: Set di metadati Vediamo subito un interfaccia molto fine anni ’90 (infatti è uno dei primi progetti) Importante: titolo, concetti che voglio che emergono insieme all’idea stessa, immagine di riferimento, categorizzazione (tutto ciò che c’è nel sito) Alla prof non piace moltissimo così Quando entro nelle varie sottosezioni il sito rimane sempre uguale, il wordframe non cambia → l’hompage deve essere unica e ha le sue caratteristiche, le pagine del primo livello gerarchico devono mantenere la testata, e comunque devono essere collegate graficamente. Poi le pagine di secondo eccetera livello gerarchico posso avere un cambiamento della modalità di visualizzazione delle informazioni. Arrivando poi nella sezione dell’item (quindi di un manoscritto) arriva il file html Bisogna inventare un sistema di identificazione univoca per classificare gli oggetti (manoscritti/libri…) → 3 lettere, punto, numero progressivo di 5 numeri. Qui non si può scorrere i manoscritti, ma bisogna sempre andare avanti e indietro scalando i livelli. Molto buona invece la classificazione per categorie Buoni anche i possibili descrittori dell’oggetto: metadati dell’item. Ci deve essere 1 solo canale di navigazione primaria. Visualizziamo poi all’interno dell’item il file xml → usa tei Ci invita ad utilizzare degli item eterogenei (o solo opere d’arte, o solo manoscritti…) ai quali noi dobbiamo realizzare un modello di descrizione ad hoc: In caso di testi (andremo a prendere dei testi pubblicamente disponibili ovviamente e trascritti) avremo il testo come in questo caso. Nel caso di oggetti audio/video ci limitiamo alla descrizione di metadati descrittivi Per le immagini: titolo immagine, immagine, una potenziale se voglio descrizione e poi metadati descrittivi del mio oggetto, analogico o della riproduzione. (Attenzione: cambiando il supporto cambiano anche i dati descrittivi = una cosa è il Colosseo, una cosa è la fotografia del Colosseo: il soggetto è lo stesso, il Colosseo, ma la data e l’autore cambiano) The Rossetti Archive - http://www.rossettiarchive.org/ Relativo al rappresentare tutta l’opera di Dante Gabriel Rossetti. Differenti tipologie di oggetti. L’autore non ha utilizzato TEI come vocabolario di annotazione, ma ne è stato usato un altro Grande importanza ai metadati. Il tasto cerca deve stare sempre in alto, è una delle prime cose che il fruitore deve vede. C’è scritto troppo nella pagina di apertura, bisogna dare più box diversi. Se c’è un catalogo lo devo vedere subito, insieme ai macrocanali in cui si suddivide la collezione. Aldo Moro Digitale - https://aldomorodigitale.unibo.it/ Prima pagina fatta bene, sintetica, chiara, poca roba: titolo, logo e immagine (che serve per immagine grafica) Click per entrare nella collezione C’è il DOI → si può creare anche noi, poi ce lo farà vedere Navigazione dei contenuti, navigazione dei query, navigazione attraverso indici, Markup Accesso diretto ai contenuti con indice di opere E ricerca per come si vuole. • Database / raccolte Spesso utilizzati per identificare i siti web di raccolta di produzioni di un autore. È caratterizzato perché ha dei sistemi di interrogazione della raccolta altamente strutturati: usa la configurazione canonica del database (quella per tabella: prima riga con campi descrittivi dell’item, colonne con i valori associati al contenuto e riga stabilisce la nozione di item = catalogo di una biblioteca). La fruizione dell’item non è per categorie concettuali (come archivi e collezioni), MA è più un’organizzazione metadati descrittivi di un oggetto. Spesso il database viene utilizzato per l’organizzazione di metadati definibili in una tabella, descrittivi di una raccolta. Ma l’accesso del testo pieno delle risorse culturali è diverso: a volte fanno parte della raccolta a tabella, ma più delle volte sono raccolte i file xml/tei visualizzati in html Digipal - The Digital Resource and Database for Palaeography, Manuscript Studies and Diplomatic - http://www.digipal.eu/ È un database di studi paleografici, diplomatica e su manoscritto. Classifica tutte le forme diverse di scrittura del manoscritto, creando un repertorio di segni grafici. Nozione di base di dati ad oggetti Fa query sul campo di dati del database Annotazione di immagini Link che cambiano status al passaggio del mouse per valorizzare l’interazione con l’utente finale Fragmentarium - https://fragmentarium.ms/ Tratta di frammenti di manoscritti. È un tentativo di associare il database, che è un file altamente strutturato per la raccolta dei dati, ad un file semi-strutturato che è un file XML/TEI. Se entro su un frammento di manoscritto vedo tutti i descrittori che corrispondono ai metadati descrittivi di singolo oggetto della mia collezione. Ogni manoscritto è reperibili e riconoscibile grazie al: • URI = ogni manoscritto è riconoscibile quindi attraverso un’indicazione univoca che ne permette la reperibilità ovunque questo oggetto si trovi. • Iiif = una nuova tecnologia che si sta sviluppando recentemente, che garantisce la massima integrabilità delle immagini, quindi permette il riuso delle immagini in diversi scopi diversi anche da quello nativo. Consente di creare questo file in formato .Jason che permette a quel file di essere riusabile a istituzioni diverse. Il documento può essere visto attraverso un immagine dichiarata tramite una licenza. Poi il frammento viene descritto secondo le categorie descrittive che sono state scelte per rappresentare questo progetto come metadati utili per il contenuto. Permette il browsing attraverso i filtri e faccette → strumenti che qualificano la descrizione attraverso a metadati, e avvicina al principio dei database = questi descrittori sono i campi utilizzati per descrivere ogni singolo oggetto della descrizione, che diventano i filtri per filtrare la raccolta: biblioteca, luogo, lingua, periodo storico… = categorie utilizzate per descrivere attraverso i metadati ogni singolo dato della mia raccolta. Hanno estratto anche tutti i nomi di persona menzionate, e quindi altro strumento di browsing, per creare indice di persone, come indice dei luoghi. Per accedere all’xml/tei si deve cliccare su </> Può essere che: - I file che noi prendiamo come item (pergamene, manoscritti) sono accessibili come TEI text, ovvero la trascrizione integrale del contenuto dell’oggetto = quando la mia immagine ha dentro del testo, la mia immagine la posso trascrivere. - MA QUI Avendo questo sito come scopo di raccogliere pagine frammentarie di manoscritti, non viene trascritto il testo, ma solo descritto il documento → infatti qui nell’xml non c’è contenuto dentro al body ; ma hanno fatto solo la descrizione codicologica. 1914-1918-online - https://encyclopedia.1914-1918-online.net/home.html È un enciclopedia internazionale della Prima guerra mondiale. Navbar un po’ troppo consistente → le norme dell’usabilità dicono che la navbar non dovrebbe avere più di 5 voci. Enfasi su quello che viene reputato particolarmente interessante all’interno del progetto, che è un browsing attraverso non solo la navbar ma anche elementi di interazioni: - Naviga non attraverso luoghi non attraverso nomi ma puntatori su una mappa. - Naviga attraverso date non attraverso elenco di dati ma linea del tempo - Naviga attraverso temi non attraverso elenco di categorie concettuali ma attraverso cloud di parole. - Possiamo sennò accedere anche attraverso indice dalla a alla z, ma anche questo filtrato tra nomi, indice universale, luogo eccetera… Qui ha usato il linguaggio rdf La particolarità di XML/TEI è di: - Marcare un testo pieno di un documento - Anche di stabilire negli hader gli elementi della descrizione XML/TEI è usato a livello interazionale come standard per la scrittura dei manoscritti. Gli item sono il nostro punto di partenza, da qui costruiamo gli aggregati che stanno ai livelli superiori. DATI E STRUTTURE - Come arricchire i dati attraverso l’attribuzione di struttura. Ed avviarci all’HTML • Dati: entità che contribuiscono a definire la nozione di documento → serie di dati=documento • Struttura: attraverso la cui possiamo rappresentare i dati DIKW pyramid In qualunque contesto istituzionale il rapporto tra dato-struttura si affronta partendo dalla nozione di dato, individuando nel dato l’unità atomica su cui esercitare qualche forma di analisi: La piramide in cui il dato è i primo livello di una progressione di conoscenza che dal dato mi consente di passare alla nozione di informazione, e dall’informazione passare alla conoscenza. Ogni giorno io dialogo con dati, che mi fanno poi conoscere qualcosa. In senso computazionale: attraversiamo tutte e tre le fasi: 1. Dati: noi comunichiamo alla macchina in stringhe numeriche, che convertisce in un sistema binario, e assimila quindi dei dati. = il dato è il principio del concetto atomico. ➢ ES: do alla macchina dei dati RED – FRANCESCA – ROMA 2. Informazioni: Poi iniziamo a lavorare con la macchina dal punto di vista di informazione quando attribuiamo ai dati un significato. Quando arricchisco il dato in un contesto espresso in modo formale, in modo che la macchina sia in grado di manipolarlo, quel dato diventa un informazione. ➢ ES: ai dati passati alla macchina attribuisco un significato. RED: è un colore – FRANCESCA: è un nome – ROMA: è una città. 3. Conoscenza: Arrivo alla conoscenza quando metto in condizione la macchina di capire che cosa significa l’informazione. Attribuisco contesto non più al dato ma all’informazione stessa. Attribuisco contesto al significato. Quando io attribuisco un marcatore alla macchina, dicendo che Francesca è un nome, la macchina non sa cosa significa nome. MA arrivo alla conoscenza quando esprimo nome semanticamente, quando insegno alla macchina cosa significa nome. ➢ ES: nome significa: ….. Quindi: Noi abbiamo a che fare con dei dati – stringhe di caratteri – che possiamo trasformare in informazioni, nel momento in cui applichiamo con il markup un eitchetta/tag che attribuisce valore a quella stringa. Dobbiamo poi concettualizzare la nostra etichetta/tag che trasforma l’informazione in conoscenza. Da qui poi l’intelligenza artificiale della macchina può arrivare a fare delle supposizioni e dei ragionamenti: - Io ho: Francesca che è una persona ed è un docente - Se poi: dico che Piero è un docente, allora la macchina mi riconosce anche Piero come persona. Più arricchisco l’ontologia con informazioni più posso fare collegamenti tra le persone e altri dati che hanno cose in comuni (anche i social network funzionano così, come facebook “persone che potrebbero interessarti”) Attenzione: qui negli esempi ho usato il markup, perché noi utilizzeremo quello. I DATI Noi partiamo dai DATI sempre! Perché ci interessano i dati? Tutto parte da: • L’analisi dati per stabilirne delle caratteristiche descrittive. Si fa una raccolta di oggetti culturali = analisi dei dati • Lo scopo che abbiamo per la creazione di una raccolta digitale = modalità di rappresentazione/manipolazione dei dati Ci sono diversi tipi di dati in letteratura: Dati NON STRUTTURATI Un testo pieno, un’immagine, un audio o un video. Una pura sequenza di numeri, una pura sequenza di pixel, una pura sequenza di frame. Dentro non c’è niente che dia informazione alla macchina. Dati STRUTTURATI È il tipo di costruttore scelto che dà struttura ovvero una tabella, un grafo, un albero. Un dato all’interno di un database è un dato strutturato. Il dato è strutturato perché si basa su uno schema che stabilisce regole e vincoli. Database = dato strutturato → perché nel caso della tabella la conoscenza è stabilita dal modello concettuale La concettualizzazione, che ci permette di arrivare alla conoscenza, è stabilita dal modello di tale relazione. Il database è un dato strutturato perché è creato con delle strutture predefinite. Dati SEMI-STRUTTURATI Elementi di annotazione che arricchiscono il dato con descrittori come i linguaggi di markup. Un documento marcato in XML è semi-strutturato. Dati con struttura parziale. File con all’interno hanno il markup, perché da un lato possiamo avere delle porzioni di carattere che sono sequenze di stringhe non interpretate e dall’altro porzioni enucleate in modo atomico. Markup = dato semi-strutturato → perché il linguaggio di marcatura è solo un’informazione, finché non arriviamo all’ontologia non arriviamo alla conoscenza. In assenza del modello concettuale parliamo di semi-strutturato perché manca l’ultimo step di struttura che ci manca per arrivare alla conoscenza. Mi posso porre il problema fra dato e informazione in due modi: • Database: • Markup Sono due metodi - non necessariamente l’uso di uno esclude l’uso dell’altro -, che servono per organizzare i dati, ovvero attribuire struttura. DATABASE Una base di dati o database è una raccolta di dati omogenei relativi ad uno specifico dominio, cioè ad un determinato settore o argomento, organizzati in modo strutturato e secondo precise convenzioni: - Omogenei in relazione al fatto che tali dati possiedono le stesse caratteristiche a livello di elementi costitutivi; - Strutturato in relazione al fatto che i dati possono essere inseriti in griglie definite, secondo una determinata struttura logica di riferimento. La nozione di database ci interessa solo dal punto di vista dell’organizzazione logica dei contenuti e non delle tecnologie correlate di cui non ci occuperemo. Esistono vari modelli di database. Il più noto è il modello relazionale, ovvero quello che usa la tabella come struttura per organizzare i dati. Funziona per tabelle: Il dato è = nome, cognome, città, matricola… Nel momento in cui colloco i dati rispetto a dei campi che qualificano delle sequenze numeriche come matricole e sequenze di lettere come nome cognome e città, faccio come il markup, sto attribuendo a dei descrittori un valore che è determinato dal fatto che sono inseriti in un campo qualificato con un etichetta. Quindi se una stringa di codici è nella sezione nomi, so che quella stringa si riferisce ad un nome. Nei database il modello concettuale (che nel markup è l’ontologia) è associato al modello entità/relazione → modello molto usato in informatica per rappresentare la conoscenza di un dominio osservato (collezioni di libri, studenti di un università… una qualsiasi collezione che condivida della proprietà), e lo fa estraendo quelle che sono le caratteristiche degli oggetti del dominio, per usare queste caratteristiche descrittive come informazione da dare ai miei dati MARKUP Quello che noi useremo. Con markup ci riferiamo alla possibilità di aggiungere alla sequenza di caratteri che rappresentano il documento digitale, altre stringhe di caratteri denominate marcatori (o anche etichette o ancora tags), utili a descrivere determinati aspetti funzionali alla produzione del documento elettronico. Questo processo di aggiunta di stringhe al flusso dei caratteri permette di specificare determinate caratteristiche del testo. Dare struttura ci serve per creare un documento digitale che può essere impiegato per diversi usi e in diversi contesti. Anche i linguaggi di markup adottano una struttura: l’albero Usare la struttura ad albero significa rispettare una struttura gerarchica e quindi i descrittori devono essere annidati uno dentro l’altro. Esistono varie tipologie di linguaggi di markup. Fra quelli cosiddetti dichiarativi, o auto-descrittivi, ci sono SGML e XML. A seconda del tipo di dato che dobbiamo rappresentare sceglieremo dunque il modello del database o il markup. Il risultato lato utente potrà sempre essere una pagina Web per la fruizione finale. Concentriamoci sul markup. Esso ci serve per: • Fare un sito web • Descrivere le caratteristiche strutturali di un testo/documento/oggetto: o per fare un ebook, o per fare una biblioteca digitale, o per scambiare documenti fra ambienti diversi, o per interrogare semanticamente un testo, o per conservare un dato a lungo termine. • QUINDI: creare oggetti digitali interoperabili, portabili, svincolati da applicazioni software, capaci di descrivere la struttura di un documento. Metalinguaggio e linguaggio di markup Esistono: • Metalinguaggi: SGML e XML sono per l’esattezza due meta-linguaggi. Cioè forniscono le sole norme sintattiche = spiegano come si fa il markup. • Linguaggi o vocabolari: che stabiliscono la liste dei termini attraverso cui descrivere le caratteristiche di ogni porzione del documento, che può quindi diventare un dato. I vocabolari ragionano per classi di documenti che potenzialmente condividono proprietà descrittive (i testi letterari, i documenti d’archivio, gli ipertesti,…). I vocabolari prendono il nome di DTD o di Schemi. Tanto più marco una porzione atomizzata di un documento (un luogo, una persona, una data, una parola chiave), tanto più trasformo il documento in una collezione di dati. Tipicamente un documento ha porzioni altamente strutturate (i metadati descrittivi) e porzioni semi-strutturate (sezioni, paragrafi, capitoli) a livello variabile. Elementi, attributi e valori MODELLO DI MARKUP = Scelta dei descrittori delle features di un documento - Ogni porzione testuale può essere descritta tramite ricorso ad un nome convenzionale che prende il nome di elemento (p.e. ‘p’ per paragrafo, ‘n’ per nota ecc.) racchiuso tra due delimitatori; la porzione strutturale viene quindi rappresentata tramite un marcatore o tag di apertura ed uno di chiusura. - Per i tags, la sintassi di SGML ci suggerisce una forma grafica simbolica (NOTAZIONE): parentesi ad angolo, o delimitatori, racchiudenti il nome dell’elemento, cioè l’identificatore dell’elemento, come tag d’apertura (<elemento>); stesse parentesi ma con l’identificatore preceduto dal simbolo dello slash / per il tag di chiusura: </elemento>). - È possibile anche associare agli elementi degli attributi, che possiedono un determinato valore. ESEMPI: ↓↓ Struttura sintattica di un documento conforme ad SGML (nessuna imposizione sul vocabolario di annotazione) Questo modello l’ho inventato io, astrattamente funziona, posso portarlo sul Web perché è quello che faremo noi con XML = elaboriamo un modello di descrizione rispetto al modello che dobbiamo descrivere, e con questo modello descriviamo tutti gli oggetti della nostra collezione. Ovviamente noi si prenderanno già fatti Nella mia poesia ci deve essere: la dichiarazione che è una poesia, il titolo, poi il fatto che sia organizzata in strofe, e il fatto che ogni strofa ha dentro i versi. I versi e le strofe possono essere numerate, e le strofe possono essere tipizzate = ho elaborato il mio linguaggio, ho stabilito quelli che sono le caratteristiche del mio modello di verifica, e li ho tradotti in stringhe di caratteri (la strofa si chiama strofa ma potevo anche chiamarla L o S o banana, basta che lo capisca io cosa è) DIGITAL HUMANITIES E PATRIMONIO CULTURALE – Francesca Tomasi Il corso intende avviare allo studio delle digital humanities. Analizzando le principali teorie, metodologie e tecniche di dominio, lo studente impara a progettare risorse umanistiche digitali. Lo studio, in particolare, degli standard archivistici, bibliografici e museali, permette allo studente di apprendere, alla fine del corso, come produrre, conservare e disseminare collezioni culturali digitali in sistemi integrati. Il corso intende avviare alle digital humanities, con un'attenzione speciale a linguaggi, modelli, strumenti e infrastrutture per la valorizzazione del patrimonio culturale: testi letterari, documenti d'archivio, materiale bibliografico e oggetti museali. Il corso sarà organizzato su 3 macro ambiti: 1. Analisi dei principali strumenti trasversali nelle DH: o Il funzionamento del WWW (protocollo, indirizzamento, linguaggi); o I linguaggi formali per la rappresentazione dei dati semi-strutturati (XML e schemi); o Il web semantico e i linked open data (Semantic Web Stack - URI, RDF e ontologie); o I sistemi di visualizzazione dai dati (HTML + CSS e principi di architettura dell'informazione); o La progettazione dell'interfaccia (elementi della pagina Web e sistemi di navigazione). Risorse online da consultare: • TEI - <http://www.tei-c.org>; <http://teibyexample.org/> • XML - <https://www.w3schools.com/xml/> • HTML, CSS, progettazione e interfaccia - <https://www.w3schools.com>; <https://www.codecademy.com/> • SEMANTIC WEB - <https://www.w3.org/standards/semanticweb/> • LINKED DATA - <http://linkeddata.org/> 2. Ricognizione delle attività di dominio delle DH, attraverso la disamina dei principali settori di ricerca in essere, ma con un'attenzione speciale a: o Digital scholarship e textual editing; o Digital libraries, archives and museums. In particolare, verranno analizzati progetti di settore per enucleare le caratteristiche specifiche del processo di costruzione di una risorsa digitale nel dominio delle DH. Risorse online da consultare: DH PROJECTS • Projects using the TEI: <http://www.tei-c.org/Activities/Projects/> • EADH projects: <http://eadh.org/projects> • Digital research tools: <https://dirtdirectory.org/> DH JOURNALS • Journal of DH - <http://journalofdigitalhumanities.org/> • DHQ - <http://www.digitalhumanities.org/dhq/> • DSH - <https://academic.oup.com/dsh> (accesso solo via proxy) • TEI journal - <https://journal.tei-c.org/journal/index> Uno STRUMENTO di riferimento generale: Paolo Monella, Digital Humanities Bibliography http://www1.unipa.it/paolo.monella/lincei/bibliography.html 3. Classificazione dei principali standard per la descrizione di risorse del patrimonio culturale, e delle ontologie derivate, in ambito di: o Disseminazione di risorse (Dublin Core); o Descrizione di testi letterari (TEI); o Descrizione archivistica (ISAD/EAD; ISAAR/EAC); o Descrizione bibliografia (ISBD, FRBR); o Gestione museale (LIDO, CIDOC-CRM); o Ambito trasversale (RAD, RIC-CM). Risorse da consultare online: • METADATA for ALL: <http://firstmonday.org/ojs/index.php/fm/article/view/1628/1543> • Jenn Riley, Seeing Standards: A Visualization of the Metadata Universe, copy 2009-10, http://jennriley.com/metadatamap/>. • W3C Incubator Group Report, Library Linked Data Incubator Group: Datasets, Value Vocabularies, and Metadata Element Sets. 25 October 2011, <https://www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset-20111025/>. Su LODLAM (Linked Open Data for Library, Archives and Museums): Mauro Guerrini, Tiziana Possemato, Linked data: un nuovo alfabeto del web semantico. JLIS.it. Vol. 4, n. 1 (Gennaio/January 2013) - <https://www.jlis.it/article/viewFile/6305/7892> Standard italiani di descrizione nel sistema MAB (Musei, Archivi, Biblioteche): • ICCU: <http://www.iccu.sbn.it/opencms/opencms/it/main/standard/> • ICCD: <http://www.iccd.beniculturali.it/index.php?it/473/standard-catalografici> • ANAI: <http://www.anai.org/anai-cms/cms.view?munu_str=0_1_3&numDoc=111> • ICOM: <http://icom.museum/professional-standards/standards-guidelines/> BIBLIOGRAFIA: Si consiglia di leggere prima dell'inizio delle lezioni, sono: • Francesca Tomasi, Metodologie informatiche e discipline umanistiche. Roma: Carocci, 2008. In particolare, i capp: 2, 4, 5, 8, 9. • A Companion to Digital Humanities, ed. Susan Schreibman, Ray Siemens, John Unsworth. Oxford: Blackwell, 2004. In particolare i capp. 1, 14, 16, 17, 22, 31. ESAME: La verifica dell'apprendimento si baserà su: 1. Progettazione di una risorsa digitale Web nel settore delle DH, con particolare riferimento alla descrizione di: - Modello architetturale (progettazione di interfaccia) e contenutistico (obiettivo della risorsa e tipo di dati); - Standard descrittivi scelti; - Modalità di accesso offerte (sistemi di navigazione e servizi). Il progetto dovrà essere sintetizzato in max 5 slide e presentato in massimo 10 minuti. 2. Realizzazione di un prototipo della risorsa Web progettata, che riusi tutte le tecnologie viste a lezione (linguaggi HTML5, CSS, XML, sistemi di controllo di autorità, standard per i beni culturali [almeno DC e TEI]), applicandole al caso pratico ideato in fase di progettazione. La presentazione della risorsa realizzata dovrà svolgersi in massimo 10 minuti. Le linee guida di progetto saranno pubblicate su IOL e messe a disposizione assieme al resto del materiale didattico. 3. Gli studenti non frequentanti sono tenuti, oltre a progettazione e realizzazione, anche alla discussione dei capitoli dei due manuali segnalati in bibliografia. È considerato frequentante lo studente che partecipa almeno al 75% delle lezioni. La valutazione sarà basata sui seguenti parametri: - Rispetto della tempistica (0-3 punti); - Adeguatezza della progettazione rispetto alle specifiche (0-9 punti); - Completezza dell'implementazione rispetto all'uso delle tecnologie (0-10 punti); - Correttezza nell'uso dei linguaggi formali (0-8 punti); - Proposta di soluzioni originali (per la lode). Un esempio pratico: gestire il ciclo vitale di un oggetto culturale Partendo da un progetto già fatto proviamo a decomporlo nei suoi elementi costitutivi per capire che metodo o modello è stato necessario usato rispetto all’intero ciclo vitale e le metodologie trasversali. Per capire la forma di un progetto già esistente dobbiamo: - Capire l’idea che sta dietro al progetto, l’idea di ricerca - Enucleare la serie di file che ci servono alla realizzazione di questo progetto (immagini, video, audio, testi…) - Conoscere le applicazioni o i programmi che servono per aprire o modificare questi file - Avere bisogno di ambienti dove manipolare, preservare e disseminare questi oggetti - Avere l’interfaccia utente  Modello Open Archival Information System (OAIS) (2002) un Sistema di gestione di informazioni in archivi (struttura di collezione dati) aperto. Ci deve essere qualcuno che produce un pacchetto informativo (SIP), che viene messo all’interno di un sistema di gestione (Ingest), che deve avere 2 sistemi: - Uno per preservare i dati (Archival Storage) - E uno per manipolare i dati (Data Management) Ogni dato comunque deve essere descritto Si crea così 2 pacchetti: - Un pacchetto di preservazione per il deposito permanente - E un pacchetto che conserviamo per l’accesso (DIP), che poi viene dato all’utente finale, il quale può ottenere delle informazioni dai dati ottenuti dal pacchetto. CASO: Vespasiano da Bisticci’s Letter A knowledge site (il nostro oggetto culturale) http://vespasianodabisticciletters.unibo.it Caso da cui partiamo al contrario per capire come è stato prodotto, come è stato descritto, come è stato archiviato, come è stato rappresentato, come è stato disseminato e come è stato fruito da un utente finale. Vediamo un’edizione digitale di una collezione di lettere del XV secolo, inviate e ricevute da Vespasiano da Bisticci, una sorta di imprenditore ante litteram, fu un capo di una scuola di copisti laici, che nella Firenze del XV secolo è stata la scuola che ha permesso alla letteratura latina ed ebraica di essere trasmessa alla posterità. Poi con l’avvento della stampa, Vespasiano si è ritirato all’Antella e lì è morto. L’idea dietro al progetto: è un knowledge site, un sito di conoscenza basato su tecnologie semantiche. L’idea è stata quella di raccogliere le lettere inviate e ricevute, per raccogliere la testimonianza di committenti che hanno richiesto delle copie di codici antichi alla scuola di Vespasiano, per riconoscere questi codici e per capire la tradizione della copia, della transizione commerciale dell’epoca. Si è editato questi strumenti, si sono annotati alcuni fenomeni che si è ritenuto più rilevanti (codici, persone, luoghi dati), annotare tutti i riferimenti al lessico della copia, tutti i nomi dei testi e dei codici menzionati, e citazioni classiche. Cosa è stato fatto 1. Recupero di tutte le lettere (da fonti materiali), acquisite digitalmente e descritte dal punto di vista degli standard per ogni tipologia documentaria 2. Trascrivo, marco e annoto il contenuto. Aggiungo un commento come forma di annotazione finalizzata all’ulteriore arricchimento del contenuto. 3. Creo come servizi strumenti vari di accesso (per persona, data, segnatura, indici degli autori classici menzionati, linea del tempo, mappa geografica…) 4. Infine, lo rendo fruibile attraverso un interfaccia web → uso tutti i dati descritti e acquisiti per creare la pagina HTML dentro la quale metterò come contenuti tutte queste cose, e le abbellisco con i CSS. 1. Manipolare i documenti – Raccogliere le fonti primarie A. La prima cosa da fare è raccogliere tutte le fonti primarie: andando in giro per biblioteche e archivi a cercare tutte le lettere di Vespasiano da Bisticci. B. Si raccolgono digitalmente ad una risoluzione adeguata rispetto alle normative vigenti (scannerizzando, fotografando…) C. Così si hanno dei file sul computer, che devono essere adeguatamente denominati = i nomi dei file sono importantissimi (no spazi ma si usa il trattino basso o alto come elemento separatore, il nome del file deve essere semanticamente auto esplicativo ci deve essere scritto tutto [istituto di conservazione, fondo, carta, recto/verso, pagina]) D. E poi vanno descritte: in questo caso abbiamo fonti diverse e quindi eterogenee su dal punto di vista della trasmissione materiale: Documenti d’archivio: documenti comunque diversi (alcune lettere autografe, altre no, altre originali, altre di Vespasiano altre no…) per descrivere queste fonti devo conoscere i principi della descrizione archivistica (che impongono di segnalare: il luogo, nome dell’istituto, nome del fondo, estremi cronologici, numero di pezzi, presenza di strumenti di corredo e l’indicazione della segnatura di ogni singola carta). Codici miscellanei: qui bisogna avere una descrizione del manoscritto (nome della città, istituto di conservazione, nome del fondo, estremi delle carte e modello di descrizione della tipologia documentaria). Codici di dedica: Anche qui altra tipologia documentaria dei manoscritti, ma in più i codici di dedica (essendo delle lettere pensate per essere donate ad un committente) quindi c’è un’attenzione in più per segnalare le pagine miniate e inchiostrate. 2. Trascrivere i documenti Dopo aver scelto le mie fonti passo alla trascrizione → vale a dire voglio rendere computabile anche il mio oggetto dotato di supporto materiale = metto la lettera sottoforma di testo → così che avrò: - Il file dell’immagine - Il file con i metadati descrittivi dell’immagine - Il file con il testo dell’immagine Allora devo: • Definire quali sono i tools che mi permettono di trascrivere= se fosse un testo contemporaneo potrei provare con OCR, ma nella scrittura manoscritta devo avere dei tools • Devo scegliere il linguaggio • Devo scegliere il formato di rappresentazione = in un caso come questo per rendere le trascrizioni fruibili sul web ad un utente finale, farò una trascrizione finalizzata alla conservazione e scambio (scelgo l’HTML, l’XML e la TEI)  scelgo il mio editor - noi usiamo Sublime Text – editor per scrivere in qualunque linguaggio di codifica (HTML-CSS-Java-TEI) • Passo alla trascrizione: - Prima cosa descriviamo la carta che cosa è, poi individuiamo i nomi i luoghi le date eccetera, - Facciamo alcune intuizioni, desumiamo alcune cose, faremo un’interpretazione del contenuto, - Infine facciamo la trascriviamo letteralmente. • Una volta acquisita la nostra trascrizione dobbiamo marcarla per annotare i fenomeni che siamo in grado di riconoscerli. XML/TEI mark-up ns:metadata + rdf files#XML:ID + string + ns:metadata ns:metadata Si trattano con ns: (namespace) → dichiarazione esplicita del tipo di vocabolario di annotazione che volevo usare, cioè la TEI. E l’elemento specifico di TEI che mi consente di esprimere quello che voglio dire → metadata rdf files#XML:ID Più ho deciso di arricchire con un secondo livello di interpretazione, creando un file esterno in rdf (quindi secondo tecnologie di carattere semantico) che mi consentisse su ogni fenomeno identificato univocamente nel mio file di partenza, di essere descritto # → frammento di una stringa di caratteri. Quindi quando la macchina vede # dopo si fa riferimento ad un contenuto che è una porzione di qualcosa che sta da qualche parte. string Questa porzione la associo ad una stinga di caratteri di un particolare ruolo ns:metadata E poi chiudo la dichiarazione del ns e la categoria concettuale. Quindi esempio: NB = la sintassi in HTML e CSS è sempre la stessa • Parentesi uncinata → < • Nome dell’elemento (della categoria concettuale) con o senza namespace per indentificare la funzione che svolge la stringa di caratteri a cui applico a quell’elemento • Spazio • Attributo → ref type • Uguale → = • Fra virgolette alte il nome dell’attributo → “people…” • Chiusa parentesi uncinata → > • Stringa di caratteri • Apri parentesi uncinata → < • Slash → / → che significa che questa categoria di appartenenza di questa stringa di caratteri è finita (cioè dopo Piero Strozzi qui finisce il nome di persona) • Solo il nome dell’elemento • Chiusa parentesi uncinata Elementi sintattici: < > = “ “ • Poi dobbiamo creare collegamenti fra dati Cosa ci aspettiamo poi di trovare in un file rdf → l’rdf è un modo per ragionare sui concetti rappresentandoli sottoforma di triple. La tripla è determinata dalla presenza di un soggetto e un oggetto collegati da un predicato (il verbo). Quindi quando noi dobbiamo dire qualcosa sui frammenti riconosciuti nel documento, non ragioniamo più per il documento nella sua interezza, ma si ragiona su sezione come persone, luoghi, dati… Ciascuno di essi deve essere identificato in modo univoco: con l’URI (Uniform Resource Identifier) che è un nome convenzionale in codice fiscale che mi permette di identificare univocamente ogni entità della mia base di conoscenza in modo univoco. Farò tutti collegamenti interni perché queste informazioni le ho acquisite all’interno del mio progetto. Cosa mi serve creare collegamenti? Non per farli vedere all’utente finale, ma solo a scopo computazionale. Quindi il principio a cui il web semantico ci porta è cercare il più possibile di valorizzare semanticamente i dati dei nostri progetti creando dei collegamenti con altri dati già esistenti in rete che possono arricchire l’esperienza dell’utente finale. • Ne consegue che la mia base di conoscenza e quindi il mio set di entità (persone, codici, lessico + relazioni) vengono arricchite recuperando informazioni già esistenti in rete che mi permettono di acquisire molte informazioni per ogni entità. Queste informazioni non le copio, non le porto nella mia base di conoscenza ma le collego attraverso gli URI. Attenzione però: io creo un collegamento con cose che non governo; perciò, se poi quel collegamento viene modificato con cose con cui non concordo è controproducente. Perciò si fa solamente per le cose oggettive: dati di natura biografica… Tutto ciò che è un approfondimento di libera interpretazione allora si arricchisce il file rdf così facendo che si possa arricchire la nostra base di conoscenza. Progetti, strumenti, piattaforme e ambienti per le DH… e per il MAB MAB = Musei, Archivi, Biblioteche Prima di avvicinarci ai linguaggi formali e capire come utilizzarli per rappresentare certe situazioni testuali, andiamo ad analizzare quello che è lo stato dell’arte su questi temi, per disporre già di esempi di progetti già realizzati. Progetti di DH: a quante cose è necessario pensare?! Per realizzare un progetto di DH è necessario porsi tutta una serie di questioni. Esempio di progetti che le raccontano: http://devdh.org/ Development for Digital Humanities Progetto di DH che racconta come dovrebbe essere un progetti di DH. Tabella su come realizzare un DH e i passi da seguire: 1. Scopri cosa sono le Digital Humanities 2. Idealizza il tuo progetto 3. Trova e prepara il tuo team e i tuoi partener: ovviamente per lavori grandi bisogna farlo 4. Individua i tuoi prodotti che potrebbero far parte del tuo progetto, individua che prodotto puoi realizzare 5. Gestisci i tempi e gli spazi del tuo progetto 6. Pensa ai dati 7. Fai campagna pubblicitaria 8. Stabilisci un budget 9. Pensa a strategie 10. Vedi come il tuo progetto viene valutato e risolvi i problemi se sta andando male 11. Quello che succede dopo? Quando il tuo progetto è terminato come si porta avanti? 12. Download http://dirtdirectory.org/ DIRT – Digital Research Tools Progetto online chiuso. Progetto di collezioni di risorse digitali per la ricerca. Era nato per cercare di raccogliere tutti i tools possibili immaginabili (anche i software) delle Digital Humanities organizzandoli per tipo di azione da svolgere: ➢ Es. tools per annotare, tools per creare un ambiente collaborativo, tools per pubblicare… Tutte le possibili azioni legate al ciclo di vita che potrebbe servire per creare un progetto di Digital Humanities. Questo poi si è evoluto in un altro progetto: http://tadirah.dariah.eu/vocab TaDiRAH - The Taxonomy of Digital Research Activities in the Humanities Pensato per cercare di stabilire il tipo di azioni necessari per la realizzazione di DH ma accompagnandolo anche capire quali sono le possibili azioni che posso svolgere e quali sono i possibili oggetti in cui riversare questo sforzo di strumenti rispetto al wordflow. Le azioni del wordflow sono affiancate alle tecniche e al tipo di oggetti che possono essere in qualche modo oggetti utili ai progetti delle DH. Adottando questo approccio tripartito tenta un po’ di creare una tassonomia di azioni e strumenti che è possibile utilizzare o svolgere nell’ambito delle DH. Repertori di Progetti: (utili per noi come riferimenti) • Digital Humanities Resources for Project Building: guides, tutorials, tools, examples, data collection & datasets http://dhresourcesforprojectbuilding.pbworks.com/w/page/69244243/FrontPage Classifica tutte le guide, gli strumenti, i tutoriali, i data e i dataset relativi alle DH. • EADH - https://eadh.org/projects → sito dell’associazione europea del DH, come raccolta di progetti online. • AIUCD - http://www.aiucd.it/progetti/ → sito dell’associazione per l’informatica umanistica e la cultura digitale, in cui c’è una sezione di progetti realizzati in Italia per il DH. Esistono anche dei cataloghi di sole edizioni digitali: • Catalogue of Digital Editions https://dig-ed-cat.eos.arz.oeaw.ac.at/ • A catalog of Digital Scholarly Editions https://www.digitale-edition.de/exist/apps/editions-browser/$app/index.html https://www.w3schools.com/ → sito che useremo per imparare html e css Quindi proviamo ad analizzare concretamente un progetto di DH In cosa consiste quindi un progetto di DH? Può essere un prodotto di vario tipo, classificato a seconda di varia terminologia: enciclopedie, edizioni, collezioni, repertori, strumenti, database, piattaforme, archivi, infrastrutture, cataloghi, aggregatori … Proveremo ad analizzarne alcuni tipi: • Archivi / collezioni / edizioni The Walt Whitman Archive - https://whitmanarchive.org/ Cosa: Uno dei primissimi progetti del settore. È la raccolta delle opere di Walt Whitman, è l’archivio della persona che colleziona tutta la produzione artistica e letteraria di uno studioso. Per chi: utile a tutti, studenti, lettori, insegnanti. Da dove: le risorse sono state prese da biblioteche e altre istituzioni culturali. Linguaggi formali: XML/TEI Possiede un: Set di metadati Vediamo subito un interfaccia molto fine anni ’90 (infatti è uno dei primi progetti) Importante: titolo, concetti che voglio che emergono insieme all’idea stessa, immagine di riferimento, categorizzazione (tutto ciò che c’è nel sito) Alla prof non piace moltissimo così Quando entro nelle varie sottosezioni il sito rimane sempre uguale, il wordframe non cambia → l’hompage deve essere unica e ha le sue caratteristiche, le pagine del primo livello gerarchico devono mantenere la testata, e comunque devono essere collegate graficamente. Poi le pagine di secondo eccetera livello gerarchico posso avere un cambiamento della modalità di visualizzazione delle informazioni. Arrivando poi nella sezione dell’item (quindi di un manoscritto) arriva il file html Bisogna inventare un sistema di identificazione univoca per classificare gli oggetti (manoscritti/libri…) → 3 lettere, punto, numero progressivo di 5 numeri. Qui non si può scorrere i manoscritti, ma bisogna sempre andare avanti e indietro scalando i livelli. Molto buona invece la classificazione per categorie Buoni anche i possibili descrittori dell’oggetto: metadati dell’item. Ci deve essere 1 solo canale di navigazione primaria. Visualizziamo poi all’interno dell’item il file xml → usa tei Ci invita ad utilizzare degli item eterogenei (o solo opere d’arte, o solo manoscritti…) ai quali noi dobbiamo realizzare un modello di descrizione ad hoc: In caso di testi (andremo a prendere dei testi pubblicamente disponibili ovviamente e trascritti) avremo il testo come in questo caso. Nel caso di oggetti audio/video ci limitiamo alla descrizione di metadati descrittivi Per le immagini: titolo immagine, immagine, una potenziale se voglio descrizione e poi metadati descrittivi del mio oggetto, analogico o della riproduzione. (Attenzione: cambiando il supporto cambiano anche i dati descrittivi = una cosa è il Colosseo, una cosa è la fotografia del Colosseo: il soggetto è lo stesso, il Colosseo, ma la data e l’autore cambiano) The Rossetti Archive - http://www.rossettiarchive.org/ Relativo al rappresentare tutta l’opera di Dante Gabriel Rossetti. Differenti tipologie di oggetti. L’autore non ha utilizzato TEI come vocabolario di annotazione, ma ne è stato usato un altro Grande importanza ai metadati. Il tasto cerca deve stare sempre in alto, è una delle prime cose che il fruitore deve vede. C’è scritto troppo nella pagina di apertura, bisogna dare più box diversi. Se c’è un catalogo lo devo vedere subito, insieme ai macrocanali in cui si suddivide la collezione. Aldo Moro Digitale - https://aldomorodigitale.unibo.it/ Prima pagina fatta bene, sintetica, chiara, poca roba: titolo, logo e immagine (che serve per immagine grafica) Click per entrare nella collezione C’è il DOI → si può creare anche noi, poi ce lo farà vedere Navigazione dei contenuti, navigazione dei query, navigazione attraverso indici, Markup Accesso diretto ai contenuti con indice di opere E ricerca per come si vuole. • Database / raccolte Spesso utilizzati per identificare i siti web di raccolta di produzioni di un autore. È caratterizzato perché ha dei sistemi di interrogazione della raccolta altamente strutturati: usa la configurazione canonica del database (quella per tabella: prima riga con campi descrittivi dell’item, colonne con i valori associati al contenuto e riga stabilisce la nozione di item = catalogo di una biblioteca). La fruizione dell’item non è per categorie concettuali (come archivi e collezioni), MA è più un’organizzazione metadati descrittivi di un oggetto. Spesso il database viene utilizzato per l’organizzazione di metadati definibili in una tabella, descrittivi di una raccolta. Ma l’accesso del testo pieno delle risorse culturali è diverso: a volte fanno parte della raccolta a tabella, ma più delle volte sono raccolte i file xml/tei visualizzati in html Digipal - The Digital Resource and Database for Palaeography, Manuscript Studies and Diplomatic - http://www.digipal.eu/ È un database di studi paleografici, diplomatica e su manoscritto. Classifica tutte le forme diverse di scrittura del manoscritto, creando un repertorio di segni grafici. Nozione di base di dati ad oggetti Fa query sul campo di dati del database Annotazione di immagini Link che cambiano status al passaggio del mouse per valorizzare l’interazione con l’utente finale Fragmentarium - https://fragmentarium.ms/ Tratta di frammenti di manoscritti. È un tentativo di associare il database, che è un file altamente strutturato per la raccolta dei dati, ad un file semi-strutturato che è un file XML/TEI. Se entro su un frammento di manoscritto vedo tutti i descrittori che corrispondono ai metadati descrittivi di singolo oggetto della mia collezione. Ogni manoscritto è reperibili e riconoscibile grazie al: • URI = ogni manoscritto è riconoscibile quindi attraverso un’indicazione univoca che ne permette la reperibilità ovunque questo oggetto si trovi. • Iiif = una nuova tecnologia che si sta sviluppando recentemente, che garantisce la massima integrabilità delle immagini, quindi permette il riuso delle immagini in diversi scopi diversi anche da quello nativo. Consente di creare questo file in formato .Jason che permette a quel file di essere riusabile a istituzioni diverse. Il documento può essere visto attraverso un immagine dichiarata tramite una licenza. Poi il frammento viene descritto secondo le categorie descrittive che sono state scelte per rappresentare questo progetto come metadati utili per il contenuto. Permette il browsing attraverso i filtri e faccette → strumenti che qualificano la descrizione attraverso a metadati, e avvicina al principio dei database = questi descrittori sono i campi utilizzati per descrivere ogni singolo oggetto della descrizione, che diventano i filtri per filtrare la raccolta: biblioteca, luogo, lingua, periodo storico… = categorie utilizzate per descrivere attraverso i metadati ogni singolo dato della mia raccolta. Hanno estratto anche tutti i nomi di persona menzionate, e quindi altro strumento di browsing, per creare indice di persone, come indice dei luoghi. Per accedere all’xml/tei si deve cliccare su </> Può essere che: - I file che noi prendiamo come item (pergamene, manoscritti) sono accessibili come TEI text, ovvero la trascrizione integrale del contenuto dell’oggetto = quando la mia immagine ha dentro del testo, la mia immagine la posso trascrivere. - MA QUI Avendo questo sito come scopo di raccogliere pagine frammentarie di manoscritti, non viene trascritto il testo, ma solo descritto il documento → infatti qui nell’xml non c’è contenuto dentro al body ; ma hanno fatto solo la descrizione codicologica. 1914-1918-online - https://encyclopedia.1914-1918-online.net/home.html È un enciclopedia internazionale della Prima guerra mondiale. Navbar un po’ troppo consistente → le norme dell’usabilità dicono che la navbar non dovrebbe avere più di 5 voci. Enfasi su quello che viene reputato particolarmente interessante all’interno del progetto, che è un browsing attraverso non solo la navbar ma anche elementi di interazioni: - Naviga non attraverso luoghi non attraverso nomi ma puntatori su una mappa. - Naviga attraverso date non attraverso elenco di dati ma linea del tempo - Naviga attraverso temi non attraverso elenco di categorie concettuali ma attraverso cloud di parole. - Possiamo sennò accedere anche attraverso indice dalla a alla z, ma anche questo filtrato tra nomi, indice universale, luogo eccetera… Qui ha usato il linguaggio rdf La particolarità di XML/TEI è di: - Marcare un testo pieno di un documento - Anche di stabilire negli hader gli elementi della descrizione XML/TEI è usato a livello interazionale come standard per la scrittura dei manoscritti. Gli item sono il nostro punto di partenza, da qui costruiamo gli aggregati che stanno ai livelli superiori. DATI E STRUTTURE - Come arricchire i dati attraverso l’attribuzione di struttura. Ed avviarci all’HTML • Dati: entità che contribuiscono a definire la nozione di documento → serie di dati=documento • Struttura: attraverso la cui possiamo rappresentare i dati DIKW pyramid In qualunque contesto istituzionale il rapporto tra dato-struttura si affronta partendo dalla nozione di dato, individuando nel dato l’unità atomica su cui esercitare qualche forma di analisi: La piramide in cui il dato è i primo livello di una progressione di conoscenza che dal dato mi consente di passare alla nozione di informazione, e dall’informazione passare alla conoscenza. Ogni giorno io dialogo con dati, che mi fanno poi conoscere qualcosa. In senso computazionale: attraversiamo tutte e tre le fasi: 1. Dati: noi comunichiamo alla macchina in stringhe numeriche, che convertisce in un sistema binario, e assimila quindi dei dati. = il dato è il principio del concetto atomico. ➢ ES: do alla macchina dei dati RED – FRANCESCA – ROMA 2. Informazioni: Poi iniziamo a lavorare con la macchina dal punto di vista di informazione quando attribuiamo ai dati un significato. Quando arricchisco il dato in un contesto espresso in modo formale, in modo che la macchina sia in grado di manipolarlo, quel dato diventa un informazione. ➢ ES: ai dati passati alla macchina attribuisco un significato. RED: è un colore – FRANCESCA: è un nome – ROMA: è una città. 3. Conoscenza: Arrivo alla conoscenza quando metto in condizione la macchina di capire che cosa significa l’informazione. Attribuisco contesto non più al dato ma all’informazione stessa. Attribuisco contesto al significato. Quando io attribuisco un marcatore alla macchina, dicendo che Francesca è un nome, la macchina non sa cosa significa nome. MA arrivo alla conoscenza quando esprimo nome semanticamente, quando insegno alla macchina cosa significa nome. ➢ ES: nome significa: ….. Quindi: Noi abbiamo a che fare con dei dati – stringhe di caratteri – che possiamo trasformare in informazioni, nel momento in cui applichiamo con il markup un eitchetta/tag che attribuisce valore a quella stringa. Dobbiamo poi concettualizzare la nostra etichetta/tag che trasforma l’informazione in conoscenza. Da qui poi l’intelligenza artificiale della macchina può arrivare a fare delle supposizioni e dei ragionamenti: - Io ho: Francesca che è una persona ed è un docente - Se poi: dico che Piero è un docente, allora la macchina mi riconosce anche Piero come persona. Più arricchisco l’ontologia con informazioni più posso fare collegamenti tra le persone e altri dati che hanno cose in comuni (anche i social network funzionano così, come facebook “persone che potrebbero interessarti”) Attenzione: qui negli esempi ho usato il markup, perché noi utilizzeremo quello. I DATI Noi partiamo dai DATI sempre! Perché ci interessano i dati? Tutto parte da: • L’analisi dati per stabilirne delle caratteristiche descrittive. Si fa una raccolta di oggetti culturali = analisi dei dati • Lo scopo che abbiamo per la creazione di una raccolta digitale = modalità di rappresentazione/manipolazione dei dati Ci sono diversi tipi di dati in letteratura: Dati NON STRUTTURATI Un testo pieno, un’immagine, un audio o un video. Una pura sequenza di numeri, una pura sequenza di pixel, una pura sequenza di frame. Dentro non c’è niente che dia informazione alla macchina. Dati STRUTTURATI È il tipo di costruttore scelto che dà struttura ovvero una tabella, un grafo, un albero. Un dato all’interno di un database è un dato strutturato. Il dato è strutturato perché si basa su uno schema che stabilisce regole e vincoli. Database = dato strutturato → perché nel caso della tabella la conoscenza è stabilita dal modello concettuale La concettualizzazione, che ci permette di arrivare alla conoscenza, è stabilita dal modello di tale relazione. Il database è un dato strutturato perché è creato con delle strutture predefinite. Dati SEMI-STRUTTURATI Elementi di annotazione che arricchiscono il dato con descrittori come i linguaggi di markup. Un documento marcato in XML è semi-strutturato. Dati con struttura parziale. File con all’interno hanno il markup, perché da un lato possiamo avere delle porzioni di carattere che sono sequenze di stringhe non interpretate e dall’altro porzioni enucleate in modo atomico. Markup = dato semi-strutturato → perché il linguaggio di marcatura è solo un’informazione, finché non arriviamo all’ontologia non arriviamo alla conoscenza. In assenza del modello concettuale parliamo di semi-strutturato perché manca l’ultimo step di struttura che ci manca per arrivare alla conoscenza. Mi posso porre il problema fra dato e informazione in due modi: • Database: • Markup Sono due metodi - non necessariamente l’uso di uno esclude l’uso dell’altro -, che servono per organizzare i dati, ovvero attribuire struttura. DATABASE Una base di dati o database è una raccolta di dati omogenei relativi ad uno specifico dominio, cioè ad un determinato settore o argomento, organizzati in modo strutturato e secondo precise convenzioni: - Omogenei in relazione al fatto che tali dati possiedono le stesse caratteristiche a livello di elementi costitutivi; - Strutturato in relazione al fatto che i dati possono essere inseriti in griglie definite, secondo una determinata struttura logica di riferimento. La nozione di database ci interessa solo dal punto di vista dell’organizzazione logica dei contenuti e non delle tecnologie correlate di cui non ci occuperemo. Esistono vari modelli di database. Il più noto è il modello relazionale, ovvero quello che usa la tabella come struttura per organizzare i dati. Funziona per tabelle: Il dato è = nome, cognome, città, matricola… Nel momento in cui colloco i dati rispetto a dei campi che qualificano delle sequenze numeriche come matricole e sequenze di lettere come nome cognome e città, faccio come il markup, sto attribuendo a dei descrittori un valore che è determinato dal fatto che sono inseriti in un campo qualificato con un etichetta. Quindi se una stringa di codici è nella sezione nomi, so che quella stringa si riferisce ad un nome. Nei database il modello concettuale (che nel markup è l’ontologia) è associato al modello entità/relazione → modello molto usato in informatica per rappresentare la conoscenza di un dominio osservato (collezioni di libri, studenti di un università… una qualsiasi collezione che condivida della proprietà), e lo fa estraendo quelle che sono le caratteristiche degli oggetti del dominio, per usare queste caratteristiche descrittive come informazione da dare ai miei dati MARKUP Quello che noi useremo. Con markup ci riferiamo alla possibilità di aggiungere alla sequenza di caratteri che rappresentano il documento digitale, altre stringhe di caratteri denominate marcatori (o anche etichette o ancora tags), utili a descrivere determinati aspetti funzionali alla produzione del documento elettronico. Questo processo di aggiunta di stringhe al flusso dei caratteri permette di specificare determinate caratteristiche del testo. Dare struttura ci serve per creare un documento digitale che può essere impiegato per diversi usi e in diversi contesti. Anche i linguaggi di markup adottano una struttura: l’albero Usare la struttura ad albero significa rispettare una struttura gerarchica e quindi i descrittori devono essere annidati uno dentro l’altro. Esistono varie tipologie di linguaggi di markup. Fra quelli cosiddetti dichiarativi, o auto-descrittivi, ci sono SGML e XML. A seconda del tipo di dato che dobbiamo rappresentare sceglieremo dunque il modello del database o il markup. Il risultato lato utente potrà sempre essere una pagina Web per la fruizione finale. Concentriamoci sul markup. Esso ci serve per: • Fare un sito web • Descrivere le caratteristiche strutturali di un testo/documento/oggetto: o per fare un ebook, o per fare una biblioteca digitale, o per scambiare documenti fra ambienti diversi, o per interrogare semanticamente un testo, o per conservare un dato a lungo termine. • QUINDI: creare oggetti digitali interoperabili, portabili, svincolati da applicazioni software, capaci di descrivere la struttura di un documento. Metalinguaggio e linguaggio di markup Esistono: • Metalinguaggi: SGML e XML sono per l’esattezza due meta-linguaggi. Cioè forniscono le sole norme sintattiche = spiegano come si fa il markup. • Linguaggi o vocabolari: che stabiliscono la liste dei termini attraverso cui descrivere le caratteristiche di ogni porzione del documento, che può quindi diventare un dato. I vocabolari ragionano per classi di documenti che potenzialmente condividono proprietà descrittive (i testi letterari, i documenti d’archivio, gli ipertesti,…). I vocabolari prendono il nome di DTD o di Schemi. Tanto più marco una porzione atomizzata di un documento (un luogo, una persona, una data, una parola chiave), tanto più trasformo il documento in una collezione di dati. Tipicamente un documento ha porzioni altamente strutturate (i metadati descrittivi) e porzioni semi-strutturate (sezioni, paragrafi, capitoli) a livello variabile. Elementi, attributi e valori MODELLO DI MARKUP = Scelta dei descrittori delle features di un documento - Ogni porzione testuale può essere descritta tramite ricorso ad un nome convenzionale che prende il nome di elemento (p.e. ‘p’ per paragrafo, ‘n’ per nota ecc.) racchiuso tra due delimitatori; la porzione strutturale viene quindi rappresentata tramite un marcatore o tag di apertura ed uno di chiusura. - Per i tags, la sintassi di SGML ci suggerisce una forma grafica simbolica (NOTAZIONE): parentesi ad angolo, o delimitatori, racchiudenti il nome dell’elemento, cioè l’identificatore dell’elemento, come tag d’apertura (<elemento>); stesse parentesi ma con l’identificatore preceduto dal simbolo dello slash / per il tag di chiusura: </elemento>). - È possibile anche associare agli elementi degli attributi, che possiedono un determinato valore. ESEMPI: ↓↓ Struttura sintattica di un documento conforme ad SGML (nessuna imposizione sul vocabolario di annotazione) Questo modello l’ho inventato io, astrattamente funziona, posso portarlo sul Web perché è quello che faremo noi con XML = elaboriamo un modello di descrizione rispetto al modello che dobbiamo descrivere, e con questo modello descriviamo tutti gli oggetti della nostra collezione. Ovviamente noi si prenderanno già fatti Nella mia poesia ci deve essere: la dichiarazione che è una poesia, il titolo, poi il fatto che sia organizzata in strofe, e il fatto che ogni strofa ha dentro i versi. I versi e le strofe possono essere numerate, e le strofe possono essere tipizzate = ho elaborato il mio linguaggio, ho stabilito quelli che sono le caratteristiche del mio modello di verifica, e li ho tradotti in stringhe di caratteri (la strofa si chiama strofa ma potevo anche chiamarla L o S o banana, basta che lo capisca io cosa è) ESERCITAZIONI Il nostro approccio XML come sintassi per la marcatura dei documenti: • Vocabolario per metadati descrittivi (paratesto) = Dublin Core (DC) • Vocabolario per elementi che qualificano la descrizione del testo rispetto al modello di rappresentazione ideato = Text Encoding Initiative (TEI) HTML come linguaggio per il Web con il fine di: • Creare il sito Web (formato .html) • Attribuire struttura alle pagine del sito (elementi semantici) • Creare un ambiente per ospitare i file XML (link dalla pagina Web) • Essere un formato di disseminazione per file XML da mostrare all’utente - funzione del linguaggio per la gestione ell’aspetto di un documento = Cascading Style Sheet (CSS) Produciamo un documento HTML con SublimeText 2 • Macro struttura • Titoli, paragrafi, sezioni • Link interni ed esterni • Immagini • Audio e video • Iframe e mappe • Attributi globali ID e CLASS • Usiamo come tutorial: https://www.w3schools.com/html • W3C Recommenadation - ALL STANDARDS AND DRAFTS: https://www.w3.org/TR • Codeacademy - https://www.codecademy.com HTML Come è fatta una pagina HTML? Ecco gli elementi obbligatori: <!DOCTYPE html> Prima riga che si chiama doctype che serve per specificare lo schema. Mi serve per dire alla macchina che le regole che deve seguire sono quelle del codice html. <html> La seconda/prima riga che deve essere anche l’ultima cosa chiusa. Tra l’html di apertura e di chiusura ci deve stare tutto il resto del documento. <head> È tutta la parte non visibile a livello di browser, cioè, dentro ci andrà tutto ciò che ci serve nel processo di interazione con il browser: gli script, i fogli di stile esterno, i metadati descrittivi della pagina). <head> obbligatoriamente ha <title>, che è l’unica cosa che viene viasualizzata  <title>…</title> Unico elemento dipendente da head che viene visualizzato. Title compare qui <body> Obbligatoriamente deve avere: <h1>…<h/1> Un titolo principale di pagina (heading) Ci sono 6 livelli di titolo, che stanno a segnare i 6 livelli gerarchici dei titoli. L’effetto che cambia nel layout con html è solamente la dimensione. <p>…</p> E uno o più paragrafi Prima o poi il paragrafo diventerà elemento strutturale e dovrò fare la chiusura accapo, perché non avrò al suo interno solo stringhe di carattere, ma magari anche altri marcatori. ATTENZIONE: solo i marcatori strutturati necessitano di andare accapo tra apertura e chiusura (<head> accapo </head) Mentre gli elementi foglia non necessitano di andare accapo (<title>…</tile>) Quando salviamo il file nel nome bisogna scrivere nome.html → nome al file punto estensione W3school per quanto riguarda lo stile lui usa gli attributi di stile → style="property:value;"> → ma alla prof non piace, non vuole che si usino, quindi ogni elemento style dobbiamo ignorarlo, li riprendiamo con il css. Elementi aggiuntivi html: <br/> è un elemento vuoto, non ha bisogno della chiusura, serve solo per far capire che bisogna andare accapo, è come pigiare la barra di invio, non ti fa lo spazietto, ma semplicemente manda il testo accapo. <hr/> È una riga orizzontale e serve come strumento di formattazione della pagina. Serve per avere enfasi sugli elementi di titolo, ad esempio, anche wikipedia ce l’ha. Siccome la prof è precisa e fanatica, dice che gli elementi vuoti andrebbero scritti con <../> ma va bene anche senza slash, quindi con <..> e basta. Però lei preferisce che lo slash ci si metta per essere puntigliosi <strong> … </strong> Porzione di testo o parola importante, che poi nel layout mi viene in grassetto, ma non sto dicendo che la parola è in grassetto, ma sto dicendo che è importante. <em>…</em> Forma di enfasi del testo, che fa l’effetto corsivo. Non lo enfatizzo perché è il titolo di un opera, perché per quello esiste un altro elemento → <cite>…</cite> Ma voglio enfatizzare per metterla in risalto, esempio parola straniera, citazione eccetera… <mark>…</mark> Per evidenziare qualcosa sempre come strumento di enfasi <del>…</del> Per tirare una riga sopra qualcosa, come per cancellarlo <sub>…</sub> Pedici <sup>…</sup> Apici <blockquote>…</blockquote> citazione lunga da una fonte <q>…</q> Citazioni brevi <abbr title=…>…</abbr> Abbreviazioni ATTEZIONE: ogni browser poi cambia come vuole questi marcatori, o alla <q> mette le virgole, o il testo accapo rientrato, o il corsivo… Commenti: <!-- Write your comments here --> Non viene visualizzato dal browser. Si usa o quando lavoro in team e devo lasciare commenti al mio collaboratore, oppure quando lavoro da solo ma comunque voglio lasciarmi dei commenti per quello che faccio. Lo uso perché non mi ricordo cose, oppure per appuntarmi che qualcosa non funziona e ci devo tornare sopra. Entità carattere e simboli: https://toolset.mrw.it/html/caratteri- speciali.html#:~:text=Le%20entit%C3%A0%20(HTML%20o%20Unciode,lettere%20e%20dalla%20comune%20punteggiatura. &entityname; &#entitynumber; Qui tutta la lista dei codici di entità carattere o simboli. Attributi: Sono stringhe di carattere che vanno all’interno del marcatore separati da uno spazio dal nome dell’elemento. <elemento attributo=”nome dell’attributo”> • Tutti gli elementi HTML possono avere attributi • Gli attributi forniscono informazioni aggiuntive sugli elementi • Gli attributi sono sempre specificati nel tag di inizio • Gli attributi di solito si trovano in coppie nome/valore come: name="value" <a href="…”> Gestione di collegamenti ipertestuali. Il link vuole sempre l’attributo Il valore di href deve essere un indirizzo. Il valore di href è il valore della risorsa che voglio aprire, in qualunque formato di file che può essere aperto se inserito in valore href. Però si cerca sempre di usare formati che non richiedono all’utente di aver installato nella sua macchina un software (tipo un word, file doc. non si usa, perché bisogna aver installato word). Posso creare due tipi di collegamenti: • Url assoluto → Quando link ad un sito esterno si chiama. Si linka tutto l’url del sito. Le linee guida dicono che quando si fa un link assoluto deve essere semanticamente auto esplicativo: l’utente deve capire cosa sta cliccando = il clicca qui è vietato!! Il link deve sempre avere: - nome di protocollo → https:// - nome di dominio → www.----.com - e in caso sottodominio, nome della cartella e/o nome del file separato da uno slash / Liste: Esistono due tipi di liste su html: <ul>…</ul> <ol>…</ol> <li>…</li> Definisce la voce dell’elenco Block and Inline Elements: Non ha una ricaduta immediata in layout ma è uno elemento di organizzazione strutturale molto importante. L’html organizza i suoi elementi come: • Elementi block: sono elementi che fanno andare accapo il testo che segue: paragrafo, tabelle, titoli… • Elementi inline: la stringa rimane nella stessa riga. Allora ci sono due elementi con la stessa identità. Servono per organizzare strutturalmente l’informazione all’interno della pagina, con lo scopo di poter manipolare dal punto di vista della gestione delle caratteristiche di layout dei font e dei colori porzioni logiche del mio documento non identificate da altri marcatori. <div>…</div> Sta per division e divide o seleziona una parte del documento html. È lo strumento per organizzare in sezioni o sottosezioni la pagina html. Identifica blocchi concettuali per divisioni di interfaccia. Si può usare anche per poi dividere concettualmente e strutturare i contenuti per poi cambiare il colore in css. <span>…</span> Mi serve per dare valore a stringhe di caratteri che non sono rappresentabili da un marcatore strutturale dell’html. Quando nessuna azione strutturale dell’html serve per quello che voglio, allora uso span per isolare la porzione di testo all’interno del paragrafo, e poi me la sistemo io con css. Poi andrò a dire ai miei fogli di stile span lo voglio così e div in quest’altro modo. Ma se ho 10 span e 20 div come faccio a far capire quale span voglio modificare? Qui entrano in gioco le classi e gli id. Attributo Class e ID: Sono attributi globali che possono essere usati insieme a qualunque elemento html Attributi class e id che vengono utilizzati nella marcatura proprio per dare ad una certa porzione logica (di-h-p…) per qualificare attraverso un certo valore il ruolo del contenuto di quell’elemento a cui io applico un certo valore di ID e un certo valore di class. Usati principalmente per dialogare con i fogli di stile esterni. id=”…” Lo uso quando voglio identificare univocamente quell’elemento. Stringhe a testo libero = uso parole mie. Questo è molto importante in html, ma soprattutto per il linguaggio XML, perché quando voglio identificare univocamente il codice di un libro mi serve l’attributo id. Non posso avere lo stesso valore attribuito a id per altri elementi. <div id=”sezione1”> → hanno in comune il concetto di div ma differenzio con l’id. Serve anche per creare i collegamenti interni in una stessa pagina, ad esempio Wikipedia che ha l’indice all’inizio, ho una pagina molto lunga, un indice che linka e mi va a finire in un altro punto del documento. Questo mi serve per fare il collegamento tra un documento e il punto preciso dello stesso o di un altro documento. Oppure anche per cliccare la freccia in fondo al documento che ti fa tornare all’inizio del documento. <span id="top"></span> → identificativo in cima al documento che quello è il top <a href="#top"> → posizionato sopra l’immagini per far capire che bisogna tornare alla porzione top, ovvero in cima al documento dove l’ho messa io. Il valore di href va a cercare un id che si chiama top (che io ho chiamato top). class=”…” Mi serve per definire una qualificazione che uno o più elementi del mio codice html possono condividere. Stringhe a testo libero = uso parole mie. ➢ Esempio: voglio qualificare e identificare tutti i nomi di persona → span class=persona. Avrò tanti class=persona quante le stringhe span condividono le caratteristiche espresse dalla class (=persona). Caratteristiche? Quelle che poi dico nel foglio di stile (le persone sono in font verdana di colore rosso) e tutte le persone del documento che io ho individuato come class=persona saranno in font verdana di colore rosso. Tutti gli elementi che condividono come valore per attributo class persona, condivideranno le caratteristiche che io individuo nel foglio di stile. Ma questo serve anche poi per categorizzare le cose nel web semantico con XML. <span class=”persona”> Iframes: Incorpora altre pagine html dentro la propria pagina html Viene usato per embeddare una mappa di google per la geolocalizzazione, un video su youtube, o una qualsiasi risorsa già esistente che io voglio inserire nel mio sito. Ovviamente deve essere il sito della risorsa che voglio inserire nel mio html, che mi mette a disposizione lo sharing da embeddare compreso già di marcatore iframe. <inframe src=”…”></iframe> Semantic Elements: Marcatori semantici che ci permettono di individuare la struttura logica della nostra pagina: Questi elementi ci consentono di attribuire una struttura logica al nostro documento. Anche in questo caso nel lato browser non si vede niente, è solamente a livello strutturale. Elementi in head: Ci spostiamo dal corpo del documento alla testata, <head>, che è il luogo dove la pagina comunica con il browser. Infatti tra <head> di apertura e </head> di chiusura possiamo inserire varie cose: <title> Per il titolo, l’intestazione che appare nella finestra del browser <style> Per definire le informazioni di stile della singola pagina html <link> Per richiamare elementi esterni. Tra cui i fogli di stile in css, attraverso l’apposito link: <link rel="stylesheet" href="nomedelfogliodistile.css"> <meta> Per i metadati, ovvero gli elementi descrittivi del contenuto della pagina, che servono per agevolare la ricerca del motore di ricerca, per garantire la reperibilità della risorsa sul web e valorizzare il dialogo e l’interscambio della nostra risorsa con altre risorse. <script> L’elemento che ci consente di dialogare con Javascript Metadati: <meta charset="UTF-8"/> Impone il set di caratteri ed è necessario per rendere leggibile l’alfabeto della tastiera anche il browser che di default non lo sopportano (esempio le lettere accentate della tastiera, alcuni browser non le leggono) Si posiziona prima o dopo <title> <meta name="viewport" content="width=device-width, initial-scale=1.0"> Con questo metadato la visualizzazione della pagina web si adatatta automaticamente allo schermo del device. Metadati che danno indicazioni descrittive del contenuto della nostra pagina web che permettono di fare una sorta di autocatalogazzione: <meta name="keywords" content="…"/> Parole chiavi che sono in grado di descrivere il contenuto della mia pagina <meta name="description" content="…"/> Descrizione della pagina web che sto realizzando, tipo abstract. Più riesco ad essere analitico nel valore di content, più riesco ad avere un valore alto, e quindi una posizione miglioro nel motore di ricerca. <meta name="author" content="…"/> Autore che realizza la pagina web
Docsity logo


Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved