Busco - Isearch

Isearch es un software de recuperación de texto de código abierto desarrollado por primera vez en 1994 por Nassib Nassar como parte del marco de información Isite Z39.50 . El proyecto comenzó en el Clearinghouse for Networked Information Discovery and Retrieval (CNIDR) del centro de supercomputación de Carolina del Norte MCNC y fue financiado por la National Science Foundation para seguir la pista de WAIS y desarrollar sistemas prototipo para redes de información distribuidas que abarcan aplicaciones de Internet y catálogos de bibliotecas. y otros recursos de información.

Las características principales de Isearch incluyen búsqueda de texto completo y campo, clasificación de relevancia, consultas booleanas y soporte para muchos tipos de documentos como HTML, carpetas de correo, resúmenes de listas, MEDLINE, BibTeX, SGML / XML, metadatos FGDC, NASA DIF, metadatos ANZLIC , Metadatos ISO 19115 y muchos otros tipos de recursos y formatos de documentos.

Fue el primer motor de búsqueda diseñado desde cero para admitir la búsqueda y recuperación SGML y Z39.50 . Incluyó muchas innovaciones, incluido el modelo de "tipo de documento", que es simplemente un método (orientado a objetos) de asociar cada documento con una clase de funciones que proporcionan una interfaz estándar para acceder al documento. Fue uno de los primeros motores (si no el primero) en admitir XML.

Los algoritmos de búsqueda / indexación de texto de Isearch se basaron en el trabajo fundamental de Gaston Gonnet en matrices PAT y árboles para la recuperación de texto, ideas que se desarrollaron para el Proyecto del Diccionario de Inglés New Oxford en la Universidad. de Waterloo, y proporcionó las semillas para el motor PAT SGML de Tim Bray que formó la base de Open Text . Sin embargo, uno de los factores limitantes del diseño de Isearch fue que no era adecuado para manejar los conjuntos de datos extremadamente grandes que se hicieron populares a mediados y finales de la década de 1990. En muchos casos, Isearch se adaptó o modificó para usar diferentes algoritmos, pero generalmente mantuvo el modelo de tipo de documento y la relación arquitectónica con Isite.

Isearch fue ampliamente adoptado y utilizado en cientos de sitios de búsqueda públicos, incluidos muchos proyectos de alto perfil como la búsqueda de patentes de la Oficina de Patentes y Marcas Registradas de los EE. UU. (USPTO), el Centro Federal de Información Geográfica (FGDC), el Directorio Maestro de Cambio Global de la NASA, la NASA EOS Guide System, el Proyecto de interoperabilidad de catálogos de la NASA, el servicio de preimpresión astronómica del Space Telescope Science Institute , The PCT Electronic Gazette de la Organización Mundial de la Propiedad Intelectual (OMPI), [[Linsearch (un motor de búsqueda de software de código abierto diseñado por Miles Efron), el Proyecto SAGE del Departamento de Colecciones Especiales de la Universidad de Emory, Eco Companion Australasia (un catálogo de recursos geoespaciales ambientales), el Servicio Nacional de Información Genómica de Australia (ANGIS), el Proyecto Open Directory y numerosos portales gubernamentales en el contexto de la Mandato de GPO del Servicio de Localizador de Información del Gobierno (GILS) (¿terminó en 2005?).

De 1994 a 1998, la mayor parte del desarrollo se centró en el Centro de intercambio de información para el descubrimiento y la recuperación de información en red (CNIDR) en Carolina del Norte (núcleo del motor) y BSn en Alemania (Doctypes). En 1998, gran parte de los desarrolladores centrales de Isearch de código abierto reorientó el desarrollo en varios derivados. En 1998 pasó a formar parte de la plataforma de software de referencia Advanced Search Facility financiada por el Departamento de Comercio de EE. UU.

A / WWW Enterprises ahora mantiene la versión de código abierto para uso público, respaldada por clientes gubernamentales que pagan, como la Oficina de Patentes y Marcas Registradas de EE. UU., NASA y FGDC, que han brindado soporte para mejorar la funcionalidad y confiabilidad del software. El paquete de software se considera una implementación de referencia del software de servicio de catálogo.

A partir de 2010, la versión de código abierto de Isearch todavía se usa en más de 250 nodos de FGDC, y por ANZLIC en Australia y contribuyentes seleccionados de Geoespacial OneStop para facilitar la recolección por parte de GOS, incluida la NOAA, la Oficina del Censo y la Oficina de campo de Tenn. De los EE. UU. Servicio de Pesca y Vida Silvestre, entre otros.

Referencias