La evolución de la búsqueda 'Más como esto': de lo léxico a los embeddings

La función 'More Like This' (MLT) permite buscar documentos similares a partir de un resultado ya seleccionado, en lugar de partir de una consulta escrita. El enfoque clásico era léxico: se extraían los términos relevantes del documento fuente y se comparaban con los de otros textos mediante técnica

¿Basta con grep? Un estudio compara estrategias de búsqueda en agentes de LLM

Un estudio empírico reciente, publicado en arXiv, examina de forma sistemática cómo la elección de la estrategia de recuperación de información interactúa con la arquitectura del agente y el paradigma de invocación de herramientas en sistemas de búsqueda agentic basados en modelos de lenguaje de gra

FAISS al descubierto: búsqueda por similitud a escala de mil millones

FAISS, la biblioteca de búsqueda por similitud de Meta, encuentra los vecinos más cercanos en espacios vectoriales de alta dimensión a escala de miles de millones de elementos. Este artículo técnico detalla los mecanismos que hacen posible esa capacidad. En la inteligencia artificial actual, las im

HPPIE: un RAG clínico que modela al paciente antes de recuperar documentos

HPPIE (Hyper-Personalized Patient Insights Engine) es una arquitectura de RAG clínico que incorpora el modelado de persona del paciente en la fase de recuperación, en lugar de relegarlo a un filtrado posterior. El proyecto fue desarrollado en una Global AI Hackathon, donde obtuvo el segundo puesto d

TurboQuant en Rust: búsqueda vectorial más veloz

Un investigador ha implementado en Rust 'TurboQuant', un algoritmo de Google Research para la búsqueda vectorial, ofreciendo una alternativa más rápida y eficiente a métodos como FAISS. La implementación, disponible en GitHub, incluye bindings para Python a través de PyO3, facilitando su uso. TurboQ

MariaDB 12.3: mejor en búsqueda vectorial que Postgres

Una reciente evaluación comparativa ha revelado que MariaDB 12.3 supera a PostgreSQL en pruebas de búsqueda vectorial, según un análisis realizado por Small Datum LLC y patrocinado por la MariaDB Foundation. Los resultados, publicados en enero y febrero de 2025, muestran que MariaDB 12.3 ofrece una

Búsqueda eficiente de trillones de vectores: un desafío

Este artículo explora el desafío de realizar búsquedas de similitud vectorial a gran escala, específicamente con 3 mil millones de vectores. El problema surge al intentar encontrar elementos semánticamente similares, una técnica crucial en aplicaciones como búsqueda, recomendaciones y recuperación g

Azure SQL integra IA: búsqueda vectorial y LangChain

Microsoft ha anunciado la disponibilidad de búsqueda vectorial nativa en Azure SQL y SQL database en Microsoft Fabric, lo que permite integrar capacidades de inteligencia artificial generativa directamente en las bases de datos. Esta nueva funcionalidad, ahora en vista previa pública, facilita la in