improved queary for vector search

2026-06-12 13:34:59 -04:00
parent a38ce4505f
commit 2efc9e30a8
1 changed files with 12 additions and 6 deletions
@@ -93,13 +93,14 @@ def search_ebooks(

    logger.info("ebook_search_start query_length=%s rerank=%s", len(query), rerank)
    timings: list[RuntimeStep] = []
-    retrieval_query, timing = timed_result("Query preparation", retrieval_query_from_text, query)
+    bm25_query, timing = timed_result("BM25 query preparation", retrieval_query_from_text, query)
    timings.append(timing)
    retrieval, timing = timed_result(
        "Hybrid retrieval",
        parallel_retrieval,
        engine,
-        retrieval_query,
+        query,
+        bm25_query,
        config,
    )
    timings.extend(retrieval.timings)
@@ -130,7 +131,12 @@ def search_ebooks(
    return response


-def parallel_retrieval(engine: Engine, query: str, config: EbookSearchConfig) -> RetrievalResponse:
+def parallel_retrieval(
+    engine: Engine,
+    vector_query: str,
+    bm25_query: str,
+    config: EbookSearchConfig,
+) -> RetrievalResponse:
    """Run vector and BM25 candidate retrieval concurrently with separate database sessions."""
    with ThreadPoolExecutor(max_workers=2, thread_name_prefix="ebook-search") as executor:
        vector_future = executor.submit(
@@ -138,14 +144,14 @@ def parallel_retrieval(engine: Engine, query: str, config: EbookSearchConfig) ->
            "Embedding + vector search",
            vector_candidates,
            engine,
-            query,
+            vector_query,
            config,
        )
        bm25_future = executor.submit(
            timed_result,
            "BM25 search",
            bm25_candidates,
-            query,
+            bm25_query,
            config,
        )
        vector_results, vector_timing = vector_future.result()
@@ -196,7 +202,7 @@ def apply_rerank(


 def vector_candidates(engine: Engine, query: str, config: EbookSearchConfig) -> list[SearchResult]:
-    """Return pgvector cosine candidates for a normalized query."""
+    """Return pgvector cosine candidates for a natural-language query."""
    with Session(engine) as session:
        model = session.scalar(select(EbookEmbeddingModel).where(EbookEmbeddingModel.name == config.embedding_model))
        if model is None: