Spaces:

HUBioDataLab
/

ASCARIS

Sleeping

fatmacankara commited on Aug 26, 2023

Commit

dc66b2b

1 Parent(s): 6877db6

Update ASCARIS.py

Files changed (1) hide show

ASCARIS.py CHANGED Viewed

@@ -12,35 +12,17 @@ from st_aggrid import AgGrid, GridOptionsBuilder, JsCode,GridUpdateMode
 import base64
 showWarningOnDirectExecution = False
-from datasets import Dataset, concatenate_datasets
-MAX_SAMPLES_IN_MEMORY = 1000
-samples_in_dset = 0
-dset = Dataset.from_dict({"col1": [], "col2": []})  # empty dataset
-path_to_save_dir = "HUBioData/input_files"
-num_chunks = 0
-for example_dict in custom_example_dict_streamer("HUBioData/AlphafoldStructures"):
-    dset = dset.add_item(example_dict)
-    samples_in_dset += 1
-    if samples_in_dset == MAX_SAMPLES_IN_MEMORY:
-        samples_in_dset = 0
-        dset.save_to_disk(f"{path_to_save_dir}{num_chunks}")
-        num_chunks =+ 1
-        dset = Dataset.from_dict({"col1": [], "col2": []})  # empty dataset
-if samples_in_dset > 0:
-    dset.save_to_disk(f"{path_to_save_dir}{num_chunks}")
-    num_chunks =+ 1
-loaded_dsets = []  # memory-mapped
-for chunk_num in range(num_chunks):
-    dset = Dataset.load_from_disk(f"{path_to_save_dir}{chunk_num}")
-    loaded_dsets.append(dset)
-final_dset = concatenate_datasets(dset)
-st.write('FİNAL DSET')
-st.write(final_dset)
 def convert_df(df):
    return df.to_csv(index=False).encode('utf-8')

 import base64
 showWarningOnDirectExecution = False
+from datasets import load_dataset
+# Replace 'dataset_name' with the name of the dataset you want to use
+dataset = load_dataset('HUBioDataLab/AlphafoldStructures')
+file_path = 'AF-A0A075B6Y9-F1-model_v4.cif.gz'
+# Access the file content
+st.write(file_path)
 def convert_df(df):
    return df.to_csv(index=False).encode('utf-8')