Spaces:

Namitg02
/

Test

Runtime error

Namitg02 commited on May 22, 2024

Commit

357e5f2

verified ·

1 Parent(s): 5e67599

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -41,14 +41,13 @@ embedding_model = SentenceTransformer("mixedbread-ai/mxbai-embed-large-v1")
 #all-MiniLM-L6-v2, BAAI/bge-base-en-v1.5,infgrad/stella-base-en-v2, BAAI/bge-large-en-v1.5 working with default dimensions
 #docs_text = [doc.text for doc in docs]
 #embed = embedding_model.embed_documents(docs_text)
-#embeddings = embedding_model.encode(docs)
-embeddings = torch.from_numpy(dataset["train"].to_pandas().to_numpy()).to(torch.float)
 #doc_func = lambda x: x.text
 #dataset = list(map(doc_func, dataset))
-#embeddings = embedding_model.embed_documents(dataset)
 #embeddings = embedding_model.embed_documents(docs)
 dataset = dataset.add_column('embeddings', embeddings)
 embedding_dim = embedding_model.get_sentence_embedding_dimension()

 #all-MiniLM-L6-v2, BAAI/bge-base-en-v1.5,infgrad/stella-base-en-v2, BAAI/bge-large-en-v1.5 working with default dimensions
 #docs_text = [doc.text for doc in docs]
 #embed = embedding_model.embed_documents(docs_text)
+#embeddings = embedding_model.encode(docs)
 #doc_func = lambda x: x.text
 #dataset = list(map(doc_func, dataset))
+embeddings = embedding_model.embed_documents(dataset[text])
 #embeddings = embedding_model.embed_documents(docs)
 dataset = dataset.add_column('embeddings', embeddings)
 embedding_dim = embedding_model.get_sentence_embedding_dimension()