hf-docs

Running

App Files Files Community

julien-c HF Staff commited on Sep 18, 2024

Commit

218d226

verified ·

1 Parent(s): 992104c

Format code

Browse files

Files changed (3) hide show

.gitignore +1 -0
.vscode/settings.json +6 -0
app.py +52 -14

.gitignore ADDED Viewed

	@@ -0,0 +1 @@


1	+ .env/

.vscode/settings.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "[python]": {
+    "editor.defaultFormatter": "ms-python.black-formatter"
+  },
+  "editor.formatOnSave": true
+}

app.py CHANGED Viewed

@@ -5,50 +5,79 @@ import torch
 from transformers import AutoModel, AutoTokenizer
 import meilisearch
-tokenizer = AutoTokenizer.from_pretrained('BAAI/bge-base-en-v1.5')
-model = AutoModel.from_pretrained('BAAI/bge-base-en-v1.5')
 model.eval()
 cuda_available = torch.cuda.is_available()
 print(f"CUDA available: {cuda_available}")
-meilisearch_client = meilisearch.Client("https://edge.meilisearch.com", os.environ["MEILISEARCH_KEY"])
 meilisearch_index_name = "docs-embed"
 meilisearch_index = meilisearch_client.index(meilisearch_index_name)
 output_options = ["RAG-friendly", "human-friendly"]
 def search_embeddings(query_text, output_option):
     start_time_embedding = time.time()
-    query_prefix = 'Represent this sentence for searching code documentation: '
-    query_tokens =  tokenizer(query_prefix + query_text, padding=True, truncation=True, return_tensors='pt', max_length=512)
     # step1: tokenizer the query
     with torch.no_grad():
         # Compute token embeddings
         model_output = model(**query_tokens)
         sentence_embeddings = model_output[0][:, 0]
         # normalize embeddings
-        sentence_embeddings = torch.nn.functional.normalize(sentence_embeddings, p=2, dim=1)
         sentence_embeddings_list = sentence_embeddings[0].tolist()
         elapsed_time_embedding = time.time() - start_time_embedding
     # step2: search meilisearch
     start_time_meilisearch = time.time()
     response = meilisearch_index.search(
-        "", opt_params={"vector": sentence_embeddings_list, "hybrid": {"semanticRatio": 1.0}, "limit": 5, "attributesToRetrieve": ["text", "source_page_url", "source_page_title", "library"]}
     )
     elapsed_time_meilisearch = time.time() - start_time_meilisearch
     hits = response["hits"]
-    sources_md = [f"[\"{hit['source_page_title']}\"]({hit['source_page_url']})" for hit in hits]
     sources_md = ", ".join(sources_md)
     # step3: present the results in markdown
     if output_option == "human-friendly":
         md = f"Stats:\n\nembedding time: {elapsed_time_embedding:.2f}s\n\nmeilisearch time: {elapsed_time_meilisearch:.2f}s\n\n---\n\n"
         for hit in hits:
-            text, source_page_url, source_page_title = hit["text"], hit["source_page_url"], hit["source_page_title"]
-            source = f"src: [\"{source_page_title}\"]({source_page_url})"
             md += text + f"\n\n{source}\n\n---\n\n"
         return md, sources_md
     elif output_option == "RAG-friendly":
@@ -59,11 +88,20 @@ def search_embeddings(query_text, output_option):
 demo = gr.Interface(
     fn=search_embeddings,
-    inputs=[gr.Textbox(label="enter your query", placeholder="Type Markdown here...", lines=10), gr.Radio(label="Select an output option", choices=output_options, value="RAG-friendly")],
     outputs=[gr.Markdown(), gr.Markdown()],
     title="HF Docs Emebddings Explorer",
-    allow_flagging="never"
 )
 if __name__ == "__main__":
-    demo.launch()

 from transformers import AutoModel, AutoTokenizer
 import meilisearch
+tokenizer = AutoTokenizer.from_pretrained("BAAI/bge-base-en-v1.5")
+model = AutoModel.from_pretrained("BAAI/bge-base-en-v1.5")
 model.eval()
 cuda_available = torch.cuda.is_available()
 print(f"CUDA available: {cuda_available}")
+meilisearch_client = meilisearch.Client(
+    "https://edge.meilisearch.com", os.environ["MEILISEARCH_KEY"]
+)
 meilisearch_index_name = "docs-embed"
 meilisearch_index = meilisearch_client.index(meilisearch_index_name)
 output_options = ["RAG-friendly", "human-friendly"]
 def search_embeddings(query_text, output_option):
     start_time_embedding = time.time()
+    query_prefix = "Represent this sentence for searching code documentation: "
+    query_tokens = tokenizer(
+        query_prefix + query_text,
+        padding=True,
+        truncation=True,
+        return_tensors="pt",
+        max_length=512,
+    )
     # step1: tokenizer the query
     with torch.no_grad():
         # Compute token embeddings
         model_output = model(**query_tokens)
         sentence_embeddings = model_output[0][:, 0]
         # normalize embeddings
+        sentence_embeddings = torch.nn.functional.normalize(
+            sentence_embeddings, p=2, dim=1
+        )
         sentence_embeddings_list = sentence_embeddings[0].tolist()
         elapsed_time_embedding = time.time() - start_time_embedding
     # step2: search meilisearch
     start_time_meilisearch = time.time()
     response = meilisearch_index.search(
+        "",
+        opt_params={
+            "vector": sentence_embeddings_list,
+            "hybrid": {"semanticRatio": 1.0},
+            "limit": 5,
+            "attributesToRetrieve": [
+                "text",
+                "source_page_url",
+                "source_page_title",
+                "library",
+            ],
+        },
     )
     elapsed_time_meilisearch = time.time() - start_time_meilisearch
     hits = response["hits"]
+    sources_md = [
+        f"[\"{hit['source_page_title']}\"]({hit['source_page_url']})" for hit in hits
+    ]
     sources_md = ", ".join(sources_md)
     # step3: present the results in markdown
     if output_option == "human-friendly":
         md = f"Stats:\n\nembedding time: {elapsed_time_embedding:.2f}s\n\nmeilisearch time: {elapsed_time_meilisearch:.2f}s\n\n---\n\n"
         for hit in hits:
+            text, source_page_url, source_page_title = (
+                hit["text"],
+                hit["source_page_url"],
+                hit["source_page_title"],
+            )
+            source = f'src: ["{source_page_title}"]({source_page_url})'
             md += text + f"\n\n{source}\n\n---\n\n"
         return md, sources_md
     elif output_option == "RAG-friendly":
 demo = gr.Interface(
     fn=search_embeddings,
+    inputs=[
+        gr.Textbox(
+            label="enter your query", placeholder="Type Markdown here...", lines=10
+        ),
+        gr.Radio(
+            label="Select an output option",
+            choices=output_options,
+            value="RAG-friendly",
+        ),
+    ],
     outputs=[gr.Markdown(), gr.Markdown()],
     title="HF Docs Emebddings Explorer",
+    allow_flagging="never",
 )
 if __name__ == "__main__":
+    demo.launch()