Apache Solr - Apache Solr

Solr
Logotipo de solr
Desarrollador (es) Fundación de software Apache
Lanzamiento estable
8.10.1 / 18 de octubre de 2021 ; Hace 0 días ( 18/10/2021 )
Repositorio Repositorio Solr
Escrito en Java
Sistema operativo Multiplataforma
Escribe API de búsqueda e índice
Licencia Licencia Apache 2.0
Sitio web solr .apache .org Edita esto en Wikidata

Solr (pronunciado "solar") es una plataforma de búsqueda empresarial de código abierto , escrita en Java . Sus características principales incluyen búsqueda de texto completo , resaltado de aciertos, búsqueda por facetas , indexación en tiempo real, agrupamiento dinámico, integración de bases de datos, características NoSQL y manejo de documentos enriquecidos (por ejemplo, Word, PDF). Proporcionando búsqueda distribuida y replicación de índices, Solr está diseñado para escalabilidad y tolerancia a fallas . Solr se usa ampliamente para casos de uso de análisis y búsqueda empresarial y tiene una comunidad de desarrollo activa y lanzamientos regulares.

Solr se ejecuta como un servidor de búsqueda de texto completo independiente. Utiliza la biblioteca de búsqueda de Lucene Java en su núcleo para la indexación y la búsqueda de texto completo, y tiene API de HTTP / XML y JSON similares a REST que lo hacen utilizable desde los lenguajes de programación más populares. La configuración externa de Solr permite que se adapte a muchos tipos de aplicaciones sin codificación Java, y tiene una arquitectura de complemento para admitir una personalización más avanzada.

Apache Solr es desarrollado de manera abierta y colaborativa por el proyecto Apache Solr en la Apache Software Foundation .

Historia

En 2004, Solr fue creado por Yonik Seeley en CNET Networks como un proyecto interno para agregar capacidad de búsqueda para el sitio web de la empresa.

En enero de 2006, CNET Networks decidió publicar abiertamente el código fuente donándolo a la Apache Software Foundation . Como cualquier proyecto nuevo de Apache, entró en un período de incubación que ayudó a resolver problemas organizativos, legales y financieros.

En enero de 2007, Solr pasó del estado de incubación a un proyecto de nivel superior independiente (TLP) y creció de manera constante con las funciones acumuladas, atrayendo así a usuarios, contribuyentes y comprometidos. Aunque es bastante nuevo como proyecto público, impulsó varios sitios web de alto tráfico.

En septiembre de 2008, se lanzó Solr 1.3 que incluye capacidades de búsqueda distribuida y mejoras de rendimiento, entre muchas otras.

En enero de 2009, Yonik Seeley junto con Grant Ingersoll y Erik Hatcher se unieron a Lucidworks (anteriormente Lucid Imagination), la primera empresa que brinda soporte comercial y capacitación para las tecnologías de búsqueda Apache Solr. Desde entonces, las ofertas de apoyo en torno a Solr han sido abundantes.

Noviembre de 2009 vio el lanzamiento de Solr 1.4. Esta versión introdujo mejoras en la indexación, búsqueda y creación de facetas junto con muchas otras mejoras, como el procesamiento de documentos enriquecidos ( PDF , Word , HTML ), la agrupación de resultados de búsqueda basada en Carrot2 y también una integración mejorada de la base de datos. La versión también incluye muchos complementos adicionales.

En marzo de 2010, los proyectos Lucene y Solr se fusionaron. Continuaron las descargas por separado, pero los productos ahora fueron desarrollados conjuntamente por un solo grupo de confirmadores.

En 2011, el esquema del número de versión de Solr se cambió para que coincida con el de Lucene. Después de Solr 1.4, la siguiente versión de Solr se etiquetó como 3.1, para mantener a Solr y Lucene en el mismo número de versión.

En octubre de 2012 se lanzó la versión 4.0 de Solr, incluida la nueva función SolrCloud. 2013 y 2014 vieron una serie de lanzamientos de Solr en la línea 4.x, aumentando constantemente el conjunto de funciones y mejorando la confiabilidad.

En febrero de 2015, se lanzó Solr 5.0, la primera versión en la que Solr se empaqueta como una aplicación independiente, terminando el soporte oficial para implementar Solr como una guerra . Solr 5.3 presentaba un marco de autenticación y autorización conectable incorporado.

En abril de 2016, se lanzó Solr 6.0. Se agregó soporte para ejecutar consultas SQL paralelas en colecciones de SolrCloud. Incluye compatibilidad con StreamExpression y un nuevo controlador JDBC para la interfaz SQL.

En septiembre de 2017, se lanzó Solr 7.0. Esta versión, entre otras cosas, agregó soporte para múltiples tipos de réplicas, escalado automático y un motor matemático.

En marzo de 2019, se lanzó Solr 8.0, incluidas muchas correcciones de errores y actualizaciones de componentes. Los nodos Solr ahora pueden escuchar y atender solicitudes HTTP / 2. Tenga en cuenta que, de forma predeterminada, las solicitudes internas también se envían mediante HTTP / 2. Además, se agregó un inicio de sesión de interfaz de usuario de administrador con soporte para BasicAuth y Kerberos. Y ahora es posible trazar expresiones matemáticas en Apache Zeppelin.

En noviembre de 2020, Bloomberg donó el operador Solr al proyecto Lucene / Solr. El operador de Solr ayuda a implementar y ejecutar Solr en Kubernetes .

En febrero de 2021, Solr se estableció como un proyecto Apache separado (TLP), independiente de Lucene.

Operaciones

Para buscar un documento, Apache Solr realiza las siguientes operaciones en secuencia:

  1. Indexación: convierte los documentos a un formato legible por máquina.
  2. Consulta: comprensión de los términos de una consulta realizada por el usuario. Estos términos pueden ser imágenes o palabras clave, por ejemplo.
  3. Mapeo: Solr mapea la consulta del usuario a los documentos almacenados en la base de datos para encontrar el resultado apropiado.
  4. Ranking: tan pronto como el motor busca los documentos indexados, clasifica los resultados por su relevancia.

Comunidad

Solr cuenta con personas y empresas que aportan nuevas funciones y corrección de errores.

Integrando Solr

Solr se incluye como búsqueda integrada en muchas aplicaciones, como sistemas de gestión de contenido y sistemas de gestión de contenido empresarial . Las distribuciones de Hadoop de Cloudera , Hortonworks y MapR incluyen a Solr como motor de búsqueda para sus productos comercializados para big data . DataStax DSE integra Solr como motor de búsqueda con Cassandra . Solr es compatible como punto final en varios marcos de procesamiento de datos y marcos de integración empresarial .

Solr expone API similares a HTTP REST estándar de la industria con soporte tanto XML como JSON , y se integrará con cualquier sistema o lenguaje de programación que admita estos estándares. Para facilitar su uso, también hay bibliotecas cliente disponibles para Java , C # , PHP , Python , Ruby y la mayoría de los otros lenguajes de programación populares.

Ver también

Referencias

Bibliografía

enlaces externos