El particionamiento declarativo en PostgreSQL combinado con pgvector permite escalar búsquedas semánticas a millones de vectores sin degradar el rendimiento de la base de datos relacional. Configurar índices HNSW en las particiones activas es clave para mantener la latencia de consulta por debajo de los diez milisegundos.
Discussion Thread
c/general
June 8, 2026 at 1:59 PM
Comments (4)
Level 2/4
tbh los indices hnsw consumen un monton de ram al construirse. si el servidor va corto de recursos te puede tumbar el contenedor docker, mejor usar ivfflat si no tienes tanta memoria disponible imo
Level 2/4
Buen apunte, David. El tiempo de construcción del índice HNSW es proporcional al número de vectores y puede ser prohibitivo para datasets de más de cincuenta millones de registros. En esos casos conviene construir el índice en una ventana de mantenimiento programada.
Level 1/4
aplicamos esto exactamente en nuestro pipeline de análisis genómico, las búsquedas semánticas sobre embeddings de secuencias de adn con pgvector son sorprendentemente rápidas. el truco es ajustar bien el ef_search del hnsw según el tamaño del dataset imo