Búsquedas semánticas en OpenCms

09 agosto 2023
Tamari Sánchez Gómez

Principales características

  • Lematización: SOLR admite la lematización, lo que significa que puede reducir las palabras a su raíz o lema utilizando algoritmos como Snowball y diccionarios de lemas personalizados. Esto garantiza que las búsquedas sean más flexibles y precisas, ya que se pueden encontrar resultados relacionados con diferentes formas gramaticales de una misma palabra.
  • Sinónimos: SOLR es capaz de utilizar diccionarios de sinónimos personalizados para buscar palabras que tengan significados similares, lo que mejora la relevancia de los resultados de búsqueda y evita que los usuarios pierdan información importante debido a términos específicos.
  • Corrección de erratas y typos: SOLR implementa un algoritmo de corrección de errores basado en la distancia de Levenshtein. Esto permite sugerir palabras alternativas que se asemejen a la palabra de búsqueda original, lo que mejora la precisión de los resultados y minimiza el impacto de errores tipográficos.

Dentro de un proyecto OpenCms, hacemos uso de Solr para indexar y buscar contenido, lo que permite a nuestros usuarios realizar búsquedas rápidas y eficientes en el sitio web. Para optimizar los resultados que nos proporciona el indexador a la hora de realizar búsquedas de texto es necesario ajustar los contenidos y los parámetros de SOLR a los contenidos del proyecto.