Spaces:

Namitg02
/

Test

Runtime error

Namitg02 commited on May 24, 2024

Commit

e96bccd

verified ·

1 Parent(s): 22e910b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -23,7 +23,7 @@ dataset = load_dataset("Namitg02/Test", split='train', streaming=False)
 #dataset = load_dataset("not-lain/wikipedia",revision = "embedded")
 #dataset = load_dataset("epfl-llm/guidelines", split='train')
 #Returns a list of dictionaries, each representing a row in the dataset.
-print(dataset[1])
 length = len(dataset)
 #Itemdetails = dataset.items()
@@ -35,9 +35,8 @@ embedding_model = SentenceTransformer("mixedbread-ai/mxbai-embed-large-v1")
 df = pd.DataFrame(dataset)
 print(df)
-embeddings = embedding_model.encode(dataset["text"])
 print(embeddings)
-df['embeddings'] = embeddings
 print(df)
 dataset = Dataset.from_pandas(df)
 print(dataset[1])

 #dataset = load_dataset("not-lain/wikipedia",revision = "embedded")
 #dataset = load_dataset("epfl-llm/guidelines", split='train')
 #Returns a list of dictionaries, each representing a row in the dataset.
+#print(dataset[1])
 length = len(dataset)
 #Itemdetails = dataset.items()
 df = pd.DataFrame(dataset)
 print(df)
+df['embeddings'] = df['text'].apply(lambda x: embedding_model.encode(x))
 print(embeddings)
 print(df)
 dataset = Dataset.from_pandas(df)
 print(dataset[1])