Spaces:

steviel
/

ICML2025

Sleeping

stefanoviel commited on Jul 9

Commit

3c2ac96

1 Parent(s): 0fd8f7a

now it works

Files changed (4) hide show

Dockerfile CHANGED Viewed

@@ -12,6 +12,8 @@ RUN apt-get update && apt-get install -y \
 COPY requirements.txt ./
 COPY src/ ./src/
 COPY papers_with_abstracts_parallel.csv ./
 RUN pip3 install -r requirements.txt

 COPY requirements.txt ./
 COPY src/ ./src/
 COPY papers_with_abstracts_parallel.csv ./
+COPY paper_embeddings.pt ./
+COPY papers_data.pkl ./
 RUN pip3 install -r requirements.txt

src/paper_embeddings.pt → paper_embeddings.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d0b1298f6ed20cb137ed06c7fe2a7633754507c1dcbd79965dfd58feb5868927
 size 5022824

 version https://git-lfs.github.com/spec/v1
+oid sha256:f89ffdcacd8896a16962b5292a9b47be7120e2d4988a6f1e3d8f694e2b1b6fb7
 size 5022824

src/papers_data.pkl → papers_data.pkl RENAMED Viewed

File without changes

src/streamlit_app.py CHANGED Viewed

@@ -9,16 +9,13 @@ from io import StringIO
 # --- Configuration ---
 EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'
-# Use /tmp directory for temporary files in Hugging Face Spaces
-script_dir = Path(__file__).parent
 # Define paths relative to the script's directory
-DATA_FILE =  './src/papers_data.pkl'
-EMBEDDINGS_FILE =  './src/paper_embeddings.pt'
 CSV_FILE = 'papers_with_abstracts_parallel.csv'
 # --- Caching Functions ---
 @st.cache_resource
 def load_embedding_model():
@@ -45,7 +42,7 @@ def create_and_save_embeddings(model, data_df):
     # Save embeddings and dataframe to /tmp directory
     try:
-        torch.save(corpus_embeddings, EMBEDDINGS_FILE)
         data_df.to_pickle(DATA_FILE)
         st.success("Embeddings and data saved successfully!")
     except Exception as e:

 # --- Configuration ---
 EMBEDDING_MODEL = 'sentence-transformers/all-MiniLM-L6-v2'
 # Define paths relative to the script's directory
+DATA_FILE =  'papers_data.pkl'
+EMBEDDINGS_FILE =  'paper_embeddings.pt'
 CSV_FILE = 'papers_with_abstracts_parallel.csv'
 # --- Caching Functions ---
 @st.cache_resource
 def load_embedding_model():
     # Save embeddings and dataframe to /tmp directory
     try:
+        torch.save(corpus_embeddings.cpu(), EMBEDDINGS_FILE)
         data_df.to_pickle(DATA_FILE)
         st.success("Embeddings and data saved successfully!")
     except Exception as e: