Git Product home page Git Product logo

whomanities-workshop-2020-05's Introduction

Workshop "Aiutare a tracciare l'evoluzione della scienza ai tempi dei coronavirus"

Chi: Workshop coordinato da Silvio Peroni nel contesto dell'iniziatia Digital WHOmanities a cura degli studenti del corso di laurea internazionale di Digital Humanities and Digital Knowledge (DHDK) con il patrocinio del dipartimento d'eccellenza di Filologia Classica e Italianistica dell'Università di Bologna.

Che cosa: Questo breve workshop (45 minuti) vuole essere un'occasione per lavorare insieme relativamente all'analisi e generazione di nuovi contenuti per arginare le problematiche emerse dal collezionare e rilasciare dati citazionali aperti attinenti a studi accademici relativi ai coronavirus.

Quando: 18 maggio 2020, dalle 11:15 alle 12:00.

Dove: Da remoto, utilizzando la piattaforma Microsoft Teams.

Perché: Lo scopo del workshop è quello di introdurre, indirettamente, alcune pratiche e tecnologie volte e favorire la diffusione dei principi dell'Open Science e Open Access (si veda anche il seminario "Open Science e Open Access nelle Scienze (Umane, e non solo)") ai giovani studiosi.

Intervista pre-workshop

La registrazione dell'intervista attinente ai temi del workshop è a disposizione in forma integrale su YouTube.

Fondamenti

If I have seen further it is by standing on the shoulders of giants.

Isaac Newton, lettera a Robert Hooke, 1675

Una citazione bibliografica è il collegamento concettuale che intercorre tra un'opera citante e un'opera citata, istanziato includendo un riferimento bibliografico in bibliografia o in nota, o in un riferimento intratestuale. Le citazioni permeano da sempre il tessuto accademico, e sono utilizzate per dare credito a teorie e studi necessari all'avanzamento della ricerca in un certo dominio.

Le funzioni che, al giorno d'oggi, possono avere le citazioni sono molteplici. Esse permettono di:

  1. essere organizzate topologicamente, definendo il grafo di connessione tra gli articoli citanti e citati nel tempo, così da evidenziale l'evoluzione della scienza nel tempo;
  2. essere studiate in termini sociologici, per l'identificazione di cattivi processi di condotta della ricerca scientifica e di accesso elitario alla scienza;
  3. sottostare a logiche prettamente quantitative, creando metriche basate su citazioni per valutare l'impatto scientifico di un'idea e/o di una persona;
  4. esprimere un valore economico, considerandole come moneta con la quale un ricercatore provvede alla sua sostentazione accademica.

Citazioni aperte

OpenCitations è un'infrastruttura accademica dedicata alla diffusione della conoscenza aperta e alla pubblicazione di dati bibliografici e citazionali aperti usando le tecnologie del Semantic Web.

In questo contesto, con aperta/o, relativamente alla conoscenza e i dati si intende

quando chiunque ha libertà di accesso, uso, modifica e condivisione ad essa – avendo al massimo come limite misure che ne preservino la provenienza e l'apertura”

Definizione di Conoscenza Aperta

OpenCitations ha da poco pubblicato una nuova collezioni di dati, il Coronavirus Open Citations Dataset (COCD). COCD attualmente (18 maggio 2020) che contiene 189697 citazioni e i metadati dei relativi 49719 articoli citanti/citati.

Problema

La copertura dei dati citazionali in COCD non è completa, perché non tutti gli editori depositano in modo aperto le informazioni relative ai riferimenti bibliografici dei loro articoli, necessari per ricostruire le citazioni.

I due obiettivi che il workshop di oggi si propone sono:

  1. capire la situazione corrente relativa alla disponibilità di dati citazionali (ovvero il link citazionale + i metadati descrittivi dell'articolo citante e citato) nell'ambito dei lavori scritti sui coronavirus negli ultimi 20 anni;
  2. estendere la collezione di link citazionali DOI-to-DOI presenti in COCD, e metterli a disposizione di tutti.

1. Situazione corrente

Domanda: in che misura gli editori non stanno contribuendo?

Sul repository GitHub di COCD ci sono una collezione di DOI di articoli che parlano di coronavirus ma i cui editori non hanno depositato i relativi riferimenti bibliografici su Crossref. Crossref è un'organizzazione (con sede a Oxford) che permette agli editori di assegnare un DOI ai propri articoli e offre servizi di conservazione e recupero dei relativi metadati.

Un DOI, Digital Object Identifier, una stringa usata per identificare documenti digitali, e ha la seguente struttura:

[prefisso]/[suffisso], ad esempio 10.1056/nejmoa2001017.

Il [prefisso] identifica l'editore che ha pubblicato il documento a cui il DOI si riferisce. Usando le API di Crossref – http://api.crossref.org/prefixes/[prefisso], ad esempio http://api.crossref.org/prefixes/10.1108 – è possibile capire chi è l'editore relativo.

L'obiettivo è quello di capire quanti articoli, per editore, non hanno depositato riferimenti bibliografici in Crossref – al 4 Aprile 2020.

2. Estendere i dati

Gli editori di alcuni articoli, identificati da DOI, potrebbero non aver messo a disposizione i relativi riferimenti bibliografici su Crossref. Le ragioni possono essere almeno quattro:

  1. gli articoli non hanno proprio specificato alcun riferimento bibliografico;
  2. l'editore non vuole rilasciare questi dati in modo aperto;
  3. l'editore non ha la forza-lavoro per estrarre i riferimenti bibliografici dai suoi articoli e metterli a disposizione in modo aperto;
  4. sono articoli pubblicati tra Aprile e Maggio 2020 e, seppur i riferimenti bibliografici sono stati depositati in Crossref, non sono stati ancora integrati in OpenCitations.

L'obiettivo è quello di estrarre a mano le citazioni DOI-to-DOI dai seguenti articoli, in cui sia l'articolo citante sia l'articolo citato siano definiti da un DOI. I DOI degli articoli citanti da considerare sono i seguenti:

10.31234/osf.io/z2x9a
10.31234/osf.io/2p57j
10.31219/osf.io/8w62r
10.35542/osf.io/9urcd
10.31219/osf.io/3wx5a
10.31219/osf.io/2zuea
10.31235/osf.io/uf3zn
10.31219/osf.io/pagmf
10.31219/osf.io/f3xzq
10.31219/osf.io/f2eka
10.31219/osf.io/swqb8
10.31234/osf.io/ye3ma
10.31235/osf.io/6yw9r
10.31234/osf.io/fdn32
10.31219/osf.io/zfg6x
10.31235/osf.io/3uqn5
10.31235/osf.io/wygpk
10.31219/osf.io/a83zh
10.31219/osf.io/8fyt6
10.31219/osf.io/tj5vk

Quello che si chiede di fare definito come segue.

  1. Recuperare il PDF dell'articolo citante sul Web, usando un browser e andando all'URL https://doi.org/[DOI], ove [DOI] è uno dei DOI della lista sopra – ad esempio https://doi.org/10.31234/osf.io/z2x9a.
  2. Nel PDF, individuare la lista dei riferimenti bibliografici citati (normalmente alla fine dell'articolo) e, per ognuno di essi:
    1. copiare e incollare l'intero riferimento sull'interfaccia di Crossref per cercare documenti, o alternativamente su Google Scholar;
    2. controllare se il documento restituito è corretto rispetto al riferimento bibliografico;
    3. indentificare il suo DOI (se definito), eventualmente andando anche sul sito dell'editore che lo ha pubblicato (su Google Scholar, questa di solito è l'unica strada per recuperare il DOI);
    4. nella tabella messa a disposizione online, copiare il DOI dell'articolo citante e di quello citato in una riga.

Materiale

Slide: Peroni S (2020). Aiutare a tracciare l'evoluzione della scienza ai tempi dei coronavirus. Versione 1.0. Zenodo. http://doi.org/10.5281/zenodo.3832939

Dati citazionali: Bel Mouddene S, Cestaro G, Coppini S, Gallo E, Lerose C, Lipari R, … Vezzani T (2020). Citazioni di alcuni articoli depositati in OSF. Versione 1.0. Zenodo. http://doi.org/10.5281/zenodo.3832935

I dati citazionali estratti e pubblicati su Zenodo sono stati anche pubblicati in CROCI, the Crowdsourced OpenCitations Index, messo a disposizione da OpenCitations.

Codice: Sono stati sviluppati due script per cercare di ottenere le informazioni per identificare quanti articoli, per editore, non hanno depositato riferimenti bibliografici in Crossref:

  • get_prefix_publisher.py, realizzato da Arcangelo Massari e Cristian Santini – permette di recuperare i nome degli editori per ogni prefisso presente nei DOI in input;
  • get_publisher_count.py, realizzato da Daniele Cavestri - permette di ottenere i DOI in input raggruppati per editore.

whomanities-workshop-2020-05's People

Contributors

essepuntato avatar

Watchers

James Cloos avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.