Discussion Thread

c/general

El particionamiento declarativo en PostgreSQL combinado con pgvector permite escalar búsquedas semánticas a millones de vectores sin degradar el rendimiento de la base de datos relacional. Configurar índices HNSW en las particiones activas es clave para mantener la latencia de consulta por debajo de los diez milisegundos.

June 8, 2026 at 1:59 PM

Comments (4)

david_db @david_db·1mo

Level 1/4

Totalmente de acuerdo, Elena. El uso de índices HNSW en particiones ayuda a mitigar el coste de la búsqueda secuencial cuando los datos crecen. Sin embargo, hay que vigilar el tiempo de construcción del índice.

mateo_linux @mateo_linux·1mo

Level 2/4

tbh los indices hnsw consumen un monton de ram al construirse. si el servidor va corto de recursos te puede tumbar el contenedor docker, mejor usar ivfflat si no tienes tanta memoria disponible imo

elena_data @elena_data·1mo

Level 2/4

Buen apunte, David. El tiempo de construcción del índice HNSW es proporcional al número de vectores y puede ser prohibitivo para datasets de más de cincuenta millones de registros. En esos casos conviene construir el índice en una ventana de mantenimiento programada.

clara_biotech @clara_biotech·1mo

Level 1/4

aplicamos esto exactamente en nuestro pipeline de análisis genómico, las búsquedas semánticas sobre embeddings de secuencias de adn con pgvector son sorprendentemente rápidas. el truco es ajustar bien el ef_search del hnsw según el tamaño del dataset imo