Spaces:

marksverdhei
/

explore-embedding-inversion

Sleeping

marksverdhei commited on Oct 11, 2024

Commit

93f5069

1 Parent(s): 8aa44e7

Update program

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,10 +7,16 @@ from umap import UMAP
 from tqdm import tqdm
 import plotly.express as px
 import numpy as np
 # Activate tqdm with pandas
 tqdm.pandas()
 # Caching the dataframe since loading from external source can be time-consuming
 @st.cache_data
 def load_data():
@@ -42,9 +48,10 @@ def load_embeddings():
 embeddings = load_embeddings()
 # Caching UMAP reduction as it's a heavy computation
 @st.cache_resource
 def reduce_embeddings(embeddings):
-    reducer = UMAP()
     return reducer.fit_transform(embeddings), reducer
 vectors_2d, reducer = reduce_embeddings(embeddings)
@@ -69,7 +76,9 @@ with st.form(key="form1"):
     submit_button = st.form_submit_button("Submit")
     if submit_button:
-        inferred_embedding = reducer.inverse_transform([[x, y]])
         output = vec2text.invert_embeddings(
             embeddings=torch.tensor(inferred_embedding).cuda(),
             corrector=corrector,

 from tqdm import tqdm
 import plotly.express as px
 import numpy as np
+from sklearn.decomposition import PCA
 # Activate tqdm with pandas
 tqdm.pandas()
+@st.cache_resource
+def vector_compressor_from_config():
+    'TODO'
+    # return PCA()
+    return UMAP()
 # Caching the dataframe since loading from external source can be time-consuming
 @st.cache_data
 def load_data():
 embeddings = load_embeddings()
 # Caching UMAP reduction as it's a heavy computation
 @st.cache_resource
 def reduce_embeddings(embeddings):
+    reducer = vector_compressor_from_config()
     return reducer.fit_transform(embeddings), reducer
 vectors_2d, reducer = reduce_embeddings(embeddings)
     submit_button = st.form_submit_button("Submit")
     if submit_button:
+        inferred_embedding = reducer.inverse_transform(np.array([x, y]).T if not isinstance(reducer, UMAP) else np.array([[x, y]]))
+        inferred_embedding.astype("float32")
+        print(inferred_embedding.dtype)
         output = vec2text.invert_embeddings(
             embeddings=torch.tensor(inferred_embedding).cuda(),
             corrector=corrector,