Búsqueda inteligente en millones de documentos
Escalado lineal y tiempos de respuesta constantes
Nuestras pruebas sobre corpus de millones de documentos muestran un tiempo de respuesta constante. Se puede usar a través de una aplicación web, o a través de una API REST.
Como aplicación web, permite una sofisticada pero intuitiva manera de escribir los términos de la búsqueda.
Demo aquí.
Descripción de la base tecnológica
Para el almacenamiento y la recuperación usa el estándar tecnológico Apache solr, una tecnología de código abierto; y KeqQ, nuestro extractor de terminologías.
El intefaz web se adapta a cualquier tipo de dispositivo (móvil, PC, tablet, etc.) gracias a Bootstrap.
Necesidades de negocio / aplicación
Empresas con grandes volúmenes de documentos, en todo tipo de formatos (pdf, Word, etc.). La búsqueda de información en sus repositorios documentales es una necesidad en todo tipo de empresas.
Ventajas competitivas
Respecto a la versión base KeyQ (extracción de terminologías y búsqueda en linea de comandos, con corpus en memoria), KeyQ-sol distribuye los documentos del corpus en discos duros de una o varias máquinas usando la tecnología Apache solr. Además, dispone de funcionalidades tales como:
– Filtros: busquedas parciales, sensibilidad a mayúsculas/minúsculas, metadatos de los ficheros.
– Selector de granularidad de la información recuperada: página, párrafo, o frase.
– Estadísticas detalladas de los textos del corpus.
– Análisis visual avanzado para identificar agrupaciones temáticas.
– Gestión de múltiples corpus, en distintos idiomas.
– Gestión de terminologías. Evaluador colaborativo de terminologías (consenso entre expertos)
– Búsquedas con operadores lógicos
Referencias previas de prestación
Hemos gestionados corpus de dominios como:
- bio: decenas de miles de artículos científicos sobre covid19.
- legal: grandes documentos de cientos de páginas, con acceso inmediato a la página/párrafo/frase más relevante para una búsqueda dada.
- Energía y medio ambiente. Miles de documentos del parlamento europeo en distintos formatos.
KeyQ ha sido desarrollado en el AInnoSpace (centro mixo UPM-Accenture) entre 2020 y 2021
Protección
- Registro sw
Grado de desarrollo
- Concepto
- Investigación
- Prototipo – lab
- Prototipo industrial
- Producción
KeyQ-solr es lo que buscabas. Ahora déjanos buscar por ti.