Sistema de manija - Handle System

El Sistema de Manejo es el registro de propiedad de la Corporación para Iniciativas de Investigación Nacional que asigna identificadores persistentes , o identificadores , a los recursos de información, y para resolver "esos identificadores en la información necesaria para ubicar, acceder y hacer uso de los recursos".

Al igual que con los identificadores que se utilizan en otros lugares de la informática, los identificadores del Sistema de identificadores son opacos y no codifican información sobre el recurso subyacente, y están vinculados solo a los metadatos relacionados con el recurso. En consecuencia, los identificadores no se invalidan debido a cambios en los metadatos.

El sistema fue desarrollado por Bob Kahn en la Corporación de Iniciativas de Investigación Nacional (CNRI). El trabajo original fue financiado por la Agencia de Proyectos de Investigación Avanzada de Defensa (DARPA) entre 1992 y 1996, como parte de un marco más amplio para servicios de objetos digitales distribuidos y, por lo tanto, fue contemporáneo del despliegue inicial de la World Wide Web , con objetivos similares.

El sistema Handle se implementó por primera vez en otoño de 1994 y fue administrado y operado por CNRI hasta diciembre de 2015, cuando se introdujo un nuevo modo de operación de "administrador múltiple primario" (MPA). La Fundación DONA ahora administra el Registro Global de Manejo del sistema y acredita las AMP, incluyendo el CNRI y la Fundación Internacional DOI. Actualmente, el sistema proporciona la infraestructura subyacente para sistemas basados ​​en identificadores como los identificadores de objetos digitales y DSpace , que se utilizan principalmente para proporcionar acceso a documentos académicos, profesionales y gubernamentales y otros recursos de información.

CNRI proporciona especificaciones y el código fuente para implementaciones de referencia para los servidores y protocolos usados ​​en el sistema bajo una "Licencia Pública" libre de regalías, similar a una licencia de código abierto.

Actualmente se están ejecutando miles de servicios de control. Más de 1000 de estos se encuentran en universidades y bibliotecas, pero también están en funcionamiento en laboratorios nacionales, grupos de investigación, agencias gubernamentales y empresas comerciales, y reciben más de 200 millones de solicitudes de resolución por mes.

Especificaciones

El sistema Handle se define en las RFC informativas 3650, 3651 y 3652 del Grupo de trabajo de ingeniería de Internet (IETF) ; incluye un conjunto abierto de protocolos, un espacio de nombres y una implementación de referencia de los protocolos. El CNRI proporciona la documentación, el software y la información relacionada en un sitio web dedicado

Los identificadores consisten en un prefijo que identifica una "autoridad para nombrar" y un sufijo que da el "nombre local" de un recurso. De manera similar a los nombres de dominio, los prefijos son emitidos a las autoridades de nombres por uno de los "administradores múltiples primarios" del sistema mediante el pago de una tarifa, que debe renovarse anualmente. Una autoridad de nombres puede crear cualquier número de identificadores, con "nombres locales" únicos, dentro de sus prefijos asignados. Un ejemplo de asa es:

  • 20.1000/100
  • 10.1000/182

En el primer ejemplo, que es el identificador de la licencia de software HANDLE.NET, 20.1000es el prefijo asignado a la autoridad de nomenclatura (en este caso, Handle.net en sí) y 100es el nombre local dentro de ese espacio de nombres. El nombre local puede constar de cualquier carácter del juego de caracteres Unicode UCS-2 . El prefijo también consta de cualquier carácter UCS-2, que no sea "/". Los prefijos constan de uno o más segmentos de autoridad de denominación, separados por puntos, que representan una jerarquía de autoridades de denominación. Por lo tanto, en el ejemplo 20es el prefijo de autoridad de nomenclatura para CNRI, mientras que 1000designa una autoridad de nomenclatura subordinada dentro del prefijo 20. Otros ejemplos de prefijos de nivel superior para las autoridades de nomenclatura federadas de la Fundación DONA son 10para identificadores DOI; 11para los identificadores asignados por la UIT ; 21para identificadores emitidos por la Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG), el centro de computación científica de la Universidad de Göttingen ; y 86para la Coalición de Servicios de Mango - China. Los prefijos "heredados" más antiguos emitidos por CNRI antes de que se instituyera la estructura de "administrador múltiple primario" (MPA) son típicamente cuatro de cinco dígitos, como en el segundo ejemplo anterior, un identificador administrado por la Universidad de Leicester . Todos los prefijos deben registrarse en el Registro Global de Manejo a través de un registrador aprobado por la Fundación DONA, normalmente por una tarifa.

Como ocurre con otros usos de las manijas en informática, la manija es opaca; es decir, no codifica información sobre el recurso subyacente y solo proporciona los medios para recuperar metadatos sobre el recurso.

Esto puede contrastarse con un localizador uniforme de recursos (URL), que puede codificar dentro del identificador atributos del recurso como el protocolo que se utilizará para acceder al servidor que contiene el recurso, el nombre de host del servidor y el número de puerto, y quizás incluso la ubicación. detalles como el nombre de un archivo en el sistema de archivos del servidor que contiene el recurso. En el sistema de manijas, estos detalles no están codificados en el identificador, pero se encuentran en los metadatos a los que está vinculado el identificador.

Los metadatos pueden incluir muchos atributos del recurso de información, como sus ubicaciones, las formas en las que está disponible, los tipos de acceso (por ejemplo, "gratuito" frente a "pago") ofrecidos y a quién. El procesamiento de los metadatos para determinar cómo y dónde se debe acceder al recurso, y la provisión del recurso al usuario, se realizan en un paso separado, llamado "resolución", utilizando un Resolver, un servidor que puede ser diferente del los involucrados en el intercambio del identificador de los metadatos. A diferencia de las URL, que pueden dejar de ser válidas si los metadatos incrustados en ellas no lo son, los identificadores no se vuelven inválidos y no es necesario cambiar cuando cambian las ubicaciones u otros atributos de metadatos. Esto ayuda a evitar que el enlace se pudra , ya que los cambios en el recurso de información (como la ubicación) solo necesitan reflejarse en cambios en los metadatos, en lugar de en cambios en cada referencia al recurso.

Cada identificador puede tener su propio administrador y la administración de los identificadores se puede realizar en un entorno distribuido, similar a los nombres de dominio DNS. Las vinculaciones de nombre a valor también se pueden proteger, tanto mediante firmas para verificar los datos como mediante una respuesta de desafío para verificar la transmisión de los datos, lo que permite que los identificadores se utilicen en aplicaciones de administración de confianza.

Es posible que el mismo recurso de información subyacente esté asociado con varios identificadores, como cuando dos bibliotecas universitarias generan identificadores (y, por lo tanto, posiblemente diferentes conjuntos de metadatos) para el mismo libro.

El sistema de mango es compatible con el sistema de nombres de dominio (DNS), pero no lo requiere, a diferencia de los identificadores persistentes como PURLs o arcas , que son similares a los mangos, pero que utilizan los nombres de dominio. Sin embargo, a diferencia de estos enfoques basados ​​en nombres de dominio, los manejadores requieren un proceso de registro de prefijo separado y manejan servidores separados de los servidores de nombres de dominio.

Los tiradores se pueden utilizar de forma nativa. o expresado como identificadores uniformes de recursos (URI) a través de un espacio de nombres dentro del esquema de URI de información ; por ejemplo, 20.1000/100puede escribirse como la URI, info:hdl/20.1000/100. Algunos espacios de nombres de Handle System, como los identificadores de objetos digitales, son espacios de nombres URI "info:" por derecho propio; por ejemplo, info:doi/10.1000/182es otra forma de escribir el identificador de la revisión actual del Manual DOI como un URI.

Algunos espacios de nombres de Handle System definen reglas de presentación especiales. Por ejemplo, identificadores de objetos digitales , que representan un alto porcentaje de los controladores existentes, se presentan generalmente con un "doi:" prefijo: doi:10.1000/182.

Cualquier identificador puede expresarse como un localizador uniforme de recursos (URL) mediante el uso del servidor proxy HTTP genérico :

Algunos sistemas basados ​​en identificadores ofrecen un servidor proxy HTTP que está diseñado para usarse con su propio sistema, como:

Implementación

La implementación del Sistema de Manejo consiste en Servicios de Manejo Local, cada uno de los cuales se compone de uno o más sitios que proporcionan los servidores que almacenan identificadores específicos. El Registro de identificador global es un Servicio de identificador local único que almacena información sobre los prefijos (también conocidos como autoridades de nomenclatura) dentro del Sistema de identificador y se puede consultar para averiguar dónde se almacenan identificadores específicos en otros Servicios de identificador local dentro de este sistema distribuido.

El sitio web de Handle System proporciona una serie de herramientas de implementación, en particular el software HANDLE.NET y las bibliotecas cliente HANDLE.NET. Los clientes de manejo se pueden incrustar en el software del usuario final (por ejemplo, un navegador web) o en el software de servidor (por ejemplo, un servidor web) y las extensiones ya están disponibles para Adobe Acrobat y Firefox .

Las bibliotecas de software de manejo de clientes están disponibles tanto en C como en Java. Algunas aplicaciones han desarrollado herramientas complementarias específicas, por ejemplo, para el sistema DOI.

La red interoperable de servidores de resolución de identificadores distribuidos (también conocida como sistema de servidor proxy) está vinculada a través de un solucionador global (que es una entidad lógica aunque físicamente descentralizada y reflejada). Los usuarios de la tecnología Handle System obtienen un prefijo de identificador creado en el Global Handle Registry. El Registro de identificador global mantiene y resuelve los prefijos de los servicios de identificador mantenidos localmente. Por lo tanto, cualquier servicio de identificador local puede resolver cualquier identificador a través del solucionador global.

Los identificadores (identificadores) son pasados ​​por un cliente, como una consulta de la autoridad de nomenclatura / prefijo, al Registro de identificadores globales (GHR) del Sistema de identificadores. El GHR responde enviando al cliente la información de ubicación para el Servicio de Manejo Local relevante (que puede consistir en múltiples servidores en múltiples sitios); A continuación, se envía una consulta al servidor correspondiente dentro del Servicio de identificador local. El Local Handle Service devuelve la información necesaria para adquirir el recurso, por ejemplo, una URL que luego se puede convertir en una redirección HTTP. (Nota: si el cliente ya tiene información sobre el LHS apropiado para consultar, se omite la consulta inicial a GHR)

Aunque el modelo original del que se deriva el sistema Handle se ocupaba de la gestión de objetos digitales, el sistema Handle no impone ningún modelo particular de relaciones entre las entidades identificadas, ni se limita a identificar solo objetos digitales: las entidades no digitales pueden estar representadas como un objeto digital correspondiente a los efectos de la gestión de objetos digitales. Se necesita cierto cuidado en la definición de tales objetos y cómo se relacionan con entidades no digitales; Existen modelos establecidos que pueden ayudar en tales definiciones, por ejemplo, Requisitos funcionales para registros bibliográficos (FRBR) , CIDOC CRM y modelo de contenido de indecs . Algunas aplicaciones han encontrado útil combinar un marco de este tipo con la aplicación de manejo: por ejemplo, la Iniciativa de aprendizaje distribuido avanzado (ADL) reúne la aplicación del Sistema de manejo con estándares existentes para contenido de aprendizaje distribuido, utilizando un Modelo de referencia de objetos de contenido compartible (SCORM) , y la implementación del sistema Identificador de Objetos Digitales (DOI) del Sistema de Manejo lo ha adoptado junto con el marco indecs para lidiar con la interoperabilidad semántica .

El sistema Handle también hace explícita la importancia del compromiso de la organización con un esquema de identificador persistente, pero no exige un modelo para garantizar dicho compromiso. Las aplicaciones individuales pueden optar por establecer sus propios conjuntos de reglas e infraestructura social para garantizar la persistencia (por ejemplo, cuando se utilizan en la aplicación DSpace y la aplicación DOI).

Criterios de diseño

El sistema Handle está diseñado para cumplir con los siguientes requisitos para contribuir a la persistencia

La cadena de identificación:

  • no se basa en ningún atributo modificable de la entidad (ubicación, propiedad o cualquier otro atributo que pueda cambiar sin cambiar la identidad del referente);
  • es opaco (preferiblemente un 'número tonto': un patrón bien conocido invita a suposiciones que pueden ser engañosas, y la semántica significativa puede no traducirse entre idiomas y puede causar conflictos de marcas registradas);
  • es único dentro del sistema (para evitar colisiones e incertidumbre referencial);
  • tiene características opcionales, pero agradables de tener, que deberían ser compatibles (legible por humanos, capaz de cortar y pegar, incrustable; se adapta a sistemas comunes, por ejemplo, especificación URI).

El mecanismo de resolución de identificadores:

  • es confiable (usando redundancia, sin puntos únicos de falla y lo suficientemente rápido como para no parecer roto);
  • es escalable (cargas más altas simplemente administradas con más computadoras);
  • es flexible (puede adaptarse a entornos informáticos cambiantes; útil para nuevas aplicaciones):
  • es de confianza (tanto la resolución como la administración tienen métodos técnicos de confianza; una entidad operativa está comprometida con el largo plazo);
  • se basa en una arquitectura abierta (fomentando los esfuerzos de apalancamiento de una comunidad en la creación de aplicaciones en la infraestructura);
  • es transparente (los usuarios no necesitan conocer los detalles de la infraestructura).

Aplicaciones

Entre los objetos que actualmente se identifican por identificadores se encuentran artículos de revistas, informes técnicos, libros, tesis y disertaciones, documentos gubernamentales, metadatos, contenido de aprendizaje distribuido y conjuntos de datos. Las manijas se utilizan en aplicaciones de marcas de agua digitales , aplicaciones GRID, repositorios y más. Aunque los usuarios individuales pueden descargar y utilizar el software HANDLE.NET de forma independiente, muchos usuarios han encontrado beneficioso colaborar en el desarrollo de aplicaciones en una federación, utilizando una política común o tecnología adicional para proporcionar servicios compartidos. Como uno de los primeros esquemas de identificadores persistentes, el Sistema de Manejo ha sido ampliamente adoptado por instituciones públicas y privadas y ha sido probado durante varios años. (Consulte Paradigma, identificadores persistentes).

Manejar Las aplicaciones del sistema pueden usar identificadores como identificadores persistentes simples (como se usa más comúnmente, para resolver la URL actual de un objeto), o pueden optar por aprovechar otras características. Su soporte para el retorno simultáneo como salida de múltiples piezas de información actual relacionada con el objeto, en estructuras de datos definidas, permite establecer prioridades para el orden en el que se utilizarán las múltiples resoluciones. Los identificadores pueden, por lo tanto, resolverse en diferentes versiones digitales del mismo contenido, en sitios espejo o en diferentes modelos comerciales (pago versus gratis, seguro versus abierto, público versus privado). También pueden resolver diferentes versiones digitales de contenido diferente, como una combinación de objetos necesarios para un curso de aprendizaje a distancia.

Hay miles de servicios de asistencia en funcionamiento en la actualidad, ubicados en 71 países, en 6 continentes; más de 1000 de ellos se ejecutan en universidades y bibliotecas. Los servicios de manejo están a cargo de federaciones de usuarios, laboratorios nacionales, universidades, centros de computación, bibliotecas (nacionales y locales), agencias gubernamentales, contratistas, corporaciones y grupos de investigación. Los principales editores utilizan el sistema Handle para la identificación persistente de contenido comercialmente negociado y de acceso abierto a través de su implementación con el sistema de identificador de objeto digital (DOI) .

El número de prefijos, que permiten a los usuarios asignar identificadores, está creciendo y se sitúa en más de 12.000 a principios de 2014. Hay seis servidores de Registro de identificadores globales de nivel superior que reciben (en promedio) 68 millones de solicitudes de resolución por mes. Los servidores proxy conocidos por CNRI, que pasan solicitudes al sistema en la Web, reciben (en promedio) 200 millones de solicitudes de resolución por mes. (Estadísticas de Handle Quick Facts).

En 2010, la CNRI y la UIT (Unión Internacional de Telecomunicaciones) celebraron un acuerdo para colaborar en el uso del Sistema de manija (y la Arquitectura de objetos digitales en general) y están trabajando en los detalles específicos de esa colaboración; en abril de 2009, la UIT incluyó el sistema de manijas como una "tendencia emergente".

Política de licencias y uso

Handle System, HANDLE.NET y Global Handle Registry son marcas comerciales de Corporation for National Research Initiatives (CNRI), una corporación de investigación y desarrollo sin fines de lucro en los EE. UU. El Handle System es objeto de patentes de CNRI, que otorga la licencia de su tecnología Handle System a través de una licencia pública, similar a una licencia de código abierto, para permitir un uso más amplio de la tecnología. La infraestructura de Handle System está respaldada por el registro de prefijo y las tarifas de servicio, y la mayoría proviene de titulares de un prefijo único. El mayor contribuyente actual es la International DOI Foundation . La Licencia Pública permite el uso comercial y no comercial a bajo costo tanto de su tecnología patentada como de la implementación de referencia del software, y permite que el software se incruste libremente en otros sistemas y productos. También se encuentra disponible un Acuerdo de servicio para los usuarios que pretenden proporcionar servicios de identificación y / o resolución utilizando la tecnología de Handle System bajo la licencia pública de Handle System.

Tecnologías relacionadas

El Handle System representa varios componentes de una arquitectura de objetos digitales a largo plazo. En enero de 2010, CNRI lanzó su software de repositorio de objetos digitales de uso general, otro componente importante de esta arquitectura. Se encuentra disponible más información sobre la versión, incluida la especificación del protocolo, el código fuente y el sistema listo para usar, clientes y utilidades.

Ver también

Referencias

enlaces externos