Datos vinculados - Linked data
En informática , los datos vinculados (a menudo en mayúsculas como datos vinculados ) son datos estructurados que están interconectados con otros datos, por lo que se vuelven más útiles a través de consultas semánticas . Se basa en tecnologías web estándar como HTTP , RDF y URI , pero en lugar de utilizarlas para servir páginas web solo para lectores humanos, las amplía para compartir información de forma que las computadoras puedan leerla automáticamente. Parte de la visión de los datos vinculados es que Internet se convierta en una base de datos global .
Tim Berners-Lee , director del World Wide Web Consortium (W3C), acuñó el término en una nota de diseño de 2006 sobre el proyecto de Web Semántica .
Los datos vinculados también pueden ser datos abiertos , en cuyo caso generalmente se describen como datos abiertos vinculados ( LOD ).
Principios
En su nota de 2006 "Datos vinculados", Tim Berners-Lee describió cuatro principios de datos vinculados, parafraseados de la siguiente manera:
- Los identificadores uniformes de recursos (URI) deben usarse para nombrar e identificar cosas individuales.
- Los URI de HTTP deben usarse para permitir que estas cosas se busquen, interpreten y, posteriormente, "desreferencian".
- Se debe proporcionar información útil sobre lo que identifica un nombre a través de estándares abiertos como RDF , SPARQL , etc.
- Al publicar datos en la Web, se debe hacer referencia a otras cosas utilizando sus nombres basados en HTTP URI.
Tim Berners-Lee luego reformuló estos principios en una conferencia TED de 2009 , nuevamente parafraseados a lo siguiente:
- Todas las cosas conceptuales deben tener un nombre que comience con HTTP .
- Buscar un nombre HTTP debería devolver datos útiles sobre el objeto en cuestión en un formato estándar.
- Cualquier otra cosa con la que esa misma cosa tenga una relación a través de sus datos también debe recibir un nombre que comience con HTTP.
Componentes
- URI
- HTTP
- Datos estructurados que utilizan términos de vocabulario controlado y definiciones de conjuntos de datos expresados en formatos de serialización de Resource Description Framework como RDFa , RDF / XML , N3 , Turtle o JSON-LD
- Plataforma de datos enlazados
Datos abiertos vinculados
Los datos abiertos vinculados son datos vinculados que son datos abiertos . Tim Berners-Lee ofrece la definición más clara de datos abiertos vinculados en diferenciación con datos vinculados.
Los datos abiertos vinculados (LOD) son datos vinculados que se publican bajo una licencia abierta, lo que no impide su reutilización de forma gratuita.
- Tim Berners-Lee, datos vinculados
Los grandes conjuntos de datos abiertos vinculados incluyen DBpedia y Wikidata .
Datos abiertos vinculados de 5 estrellas
Tim Berners-Lee ha sugerido un esquema de 5 estrellas para calificar la calidad de los datos abiertos en la web, para el cual la clasificación más alta es Linked Open Data:
- 1 estrella: los datos están disponibles abiertamente en cualquier formato.
- 2 estrellas: los datos están disponibles en un formato estructurado, como el formato de archivo de Microsoft Excel (.xls).
- 3 estrellas: los datos están disponibles en un formato estructurado no propietario, como valores separados por comas (.csv).
- 4 estrellas: los datos siguen los estándares W3C , como usar RDF y emplear URI .
- 5 estrellas: todas las demás, además de enlaces a otras fuentes de datos abiertos vinculados.
Historia
El término "datos abiertos vinculados" se ha utilizado desde al menos febrero de 2007, cuando se creó la lista de correo "Vinculación de datos abiertos". La lista de correo fue alojada inicialmente por el proyecto SIMILE en el Instituto de Tecnología de Massachusetts .
Vinculación del proyecto comunitario de datos abiertos
El objetivo del proyecto comunitario Linking Open Data del grupo W3C Semantic Web Education and Outreach es extender la Web con datos comunes mediante la publicación de varios conjuntos de datos abiertos como RDF en la Web y estableciendo enlaces RDF entre elementos de datos de diferentes fuentes de datos. En octubre de 2007, los conjuntos de datos consistían en más de dos mil millones de triples RDF , que estaban interconectados por más de dos millones de enlaces RDF. En septiembre de 2011, esto había aumentado a 31 mil millones de RDF triples, interconectados por alrededor de 504 millones de enlaces RDF. En 2014 se publicó un desglose estadístico detallado.
Proyectos de la Unión Europea
Hay varios proyectos de la Unión Europea que involucran datos vinculados. Estos incluyen el proyecto de datos abiertos vinculados las 24 horas (LATC), el proyecto PlanetData, el proyecto DaPaaS (Data-and-Platform-as-a-Service) y el proyecto Linked Open Data 2 (LOD2). La vinculación de datos es uno de los principales objetivos del portal de datos abiertos de la UE , que pone a disposición miles de conjuntos de datos para que cualquiera pueda reutilizarlos y vincularlos.
Ontologías
Las ontologías son descripciones formales de estructuras de datos. Algunas de las ontologías más conocidas son:
- FOAF : una ontología que describe a las personas, sus propiedades y relaciones.
- UMBEL : una estructura de referencia ligera de 20.000 clases de conceptos de materias y sus relaciones derivadas de OpenCyc , que pueden actuar como clases vinculantes a datos externos; también tiene enlaces a 1,5 millones de entidades nombradas de DBpedia y YAGO
Conjuntos de datos
- DBpedia : un conjunto de datos que contiene datos extraídos de Wikipedia; contiene alrededor de 3.4 millones de conceptos descritos por mil millones de triples , incluidos resúmenes en 11 idiomas diferentes
- GeoNames : proporciona descripciones RDF de más de 7.500.000 características geográficas en todo el mundo.
- Wikidata : un conjunto de datos vinculados creado en colaboración que actúa como almacenamiento central para los datos estructurados de sus proyectos hermanos de la Fundación Wikimedia.
- Base de datos de identificadores de investigación global ( GRID ): una base de datos internacional de 89,506 instituciones dedicadas a la investigación académica, con 14,401 relaciones, modela dos tipos de relaciones: una relación entre padres e hijos que define una asociación subordinada y una relación relacionada que describe otras asociaciones.
Relaciones de clases e instancias de conjuntos de datos
Los diagramas en los que se puede hacer clic que muestran los conjuntos de datos individuales y sus relaciones dentro de la nube LOD generada por DBpedia (como se muestra en las figuras de la derecha) están disponibles.
Ver también
- American Art Collaborative : consorcio de museos de arte de EE. UU. Comprometidos con el establecimiento de una masa crítica de datos abiertos vinculados sobre el arte estadounidense.
- Control de autoridad : acerca de los encabezados controlados en los catálogos de bibliotecas
- Análisis de citas: para citas entre artículos académicos
- Hiperdatos
- Modelo de red : un tipo más antiguo de sistema de gestión de bases de datos.
- Schema.org
- VoID - Vocabulario de conjuntos de datos interconectados
- Lenguaje de ontología web
Referencias
Otras lecturas
- Ahmet Soylu, Felix Mödritscher y Patrick De Causmaecker. 2012. "Navegación web ubicua mediante la recolección de datos semánticos integrados: un escenario móvil". Ingeniería asistida por computadora integrada 19 (1): 93–109.
- Datos enlazados: Evolución de la web en un espacio de datos global (2011) por Tom Heath y Christian Bizer, Synthesis Lectures on the Semantic Web: Theory and Technology, Morgan & Claypool
- Cómo publicar datos vinculados en la web , por Chris Bizer, Richard Cyganiak y Tom Heath, Tutorial de datos vinculados en Freie Universität Berlin, Alemania, 27 de julio de 2007.
- La Web cumple 20 años: los datos enlazados dan poder a las personas , parte 1 de 4, por Mark Fischetti, Scientific American 2010 23 de octubre
- Los datos enlazados son simplemente más datos : Prateek Jain, Pascal Hitzler , Peter Z. Yeh, Kunal Verma y Amit P. Sheth. En: Dan Brickley, Vinay K. Chaudhri, Harry Halpin y Deborah McGuinness: los datos enlazados se encuentran con la inteligencia artificial . Informe técnico SS-10-07, AAAI Press, Menlo Park, California, 2010, págs. 82–86.
- Más allá de lo mismo que con PLATO: detección de partonomías para datos enlazados : Prateek Jain, Pascal Hitzler , Kunal Verma, Peter Z. Yeh, Amit Sheth. En: Actas de la 23a conferencia ACM sobre hipertexto y redes sociales (HT 2012), Milwaukee, WI, EE. UU., 25 al 28 de junio de 2012.
- Freitas, André, Edward Curry, João Gabriel Oliveira y Sean O'Riain. 2012. "Consulta de conjuntos de datos heterogéneos en la web de datos vinculados: desafíos, enfoques y tendencias". Computación de Internet IEEE 16 (1): 24–33.
- Interconexión de datos abiertos en la Web : Chris Bizer, Tom Heath, Danny Ayers, Yves Raimond. In Proceedings Poster Track, ESWC2007, Innsbruck, Austria
- Alineación de ontologías para datos abiertos enlazados : Prateek Jain, Pascal Hitzler , Amit Sheth, Kunal Verma, Peter Z. Yeh. En las actas de la 9a Conferencia Internacional de Web Semántica, ISWC 2010, Shanghai, China
- Datos de fármacos abiertos vinculados para la investigación y el desarrollo farmacéuticos : J Cheminform. 2011; 3:19. Samwald, Jentzsch, Bouton, Kallesøe, Willighagen, Hajagos, Marshall, Prud'hommeaux, Hassenzadeh, Pichler y Stephens (mayo de 2011)
- Entrevista con Sören Auer, responsable del proyecto LOD2 sobre la continuación de LOD2 en 2011 , junio de 2011
- Datos abiertos enlazados: lo esencial - Florian Bauer y Martin Kaltenböck (enero de 2012)
- El aleteo de un ala de mariposa - semanticweb.com Richard Wallis (febrero de 2012)
enlaces externos
Scholia tiene un perfil de tema para datos vinculados . |
- LinkedData en el W3C Wiki
- LinkedData.org
- Documentos técnicos de OpenLink Software
- enlace muerto permanente ] Datos del esquema SQL de Northwind como datos vinculados, demostración de caso de uso
- Datos vinculados para la disciplina de la numismática , demostración de caso de uso
- Demostración interactiva de LOD
- OptiqueVQS: una herramienta de formulación de consultas visuales basada en ontologías