fix(ColbertRerank): calculate ColBERT similarity per token rather than vs...

fix(ColbertRerank): calculate ColBERT similarity per token rather than vs pooled query embeds (#11335) fix: calculate ColBERT similarity per token rather than vs pooled query embedding

fix(ColbertRerank): calculate ColBERT similarity per token rather than vs...
b285c6f8 · Benjamin Clavié · GitHub · ab367af7 · b285c6f8
Unverified Commit b285c6f8 authored 1 year ago by Benjamin Clavié Committed by GitHub 1 year ago
--- a/llama-index-integrations/postprocessor/llama-index-postprocessor-colbert-rerank/llama_index/postprocessor/colbert_rerank/base.py
+++ b/llama-index-integrations/postprocessor/llama-index-postprocessor-colbert-rerank/llama_index/postprocessor/colbert_rerank/base.py
@@ -53,9 +53,7 @@ class ColbertRerank(BaseNodePostprocessor):
        # Query: [batch_size, query_length, embedding_size] -> [batch_size, query_length, 1, embedding_size]
        # Document: [batch_size, doc_length, embedding_size] -> [batch_size, 1, doc_length, embedding_size]
        query_encoding = self._tokenizer(query, return_tensors="pt")
-        query_embedding = (
-            self._model(**query_encoding).last_hidden_state.mean(dim=1).unsqueeze(0)
-        )
+        query_embedding = self._model(**query_encoding).last_hidden_state
        rerank_score_list = []

        for document_text in documents_text_list: