Spaces:

soiz1
/

dl

Running

soiz1 commited on Jan 24

Commit

b77d102

verified ·

1 Parent(s): 8fc9d5f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,19 +3,32 @@ import os
 import json
 import shutil
 import gradio as gr
 def process_and_zip_folders(huggingface_dataset_url, output_dir):
     # URLからリポジトリIDを抽出
     if huggingface_dataset_url.startswith("https://huggingface.co/"):
         repo_id = huggingface_dataset_url.replace("https://huggingface.co/", "").rstrip("/")
-        # 'datasets/'がURLに含まれている場合、取り除く
         if repo_id.startswith("datasets/"):
             repo_id = repo_id[len("datasets/"):]
     else:
         repo_id = huggingface_dataset_url
-    # データセットをダウンロード (repo_type='dataset' を指定)
-    dataset_path = snapshot_download(repo_id, repo_type="dataset", force_download=True)
     # 処理対象のフォルダ
     folders = [

 import json
 import shutil
 import gradio as gr
+import time
 def process_and_zip_folders(huggingface_dataset_url, output_dir):
     # URLからリポジトリIDを抽出
     if huggingface_dataset_url.startswith("https://huggingface.co/"):
         repo_id = huggingface_dataset_url.replace("https://huggingface.co/", "").rstrip("/")
         if repo_id.startswith("datasets/"):
             repo_id = repo_id[len("datasets/"):]
     else:
         repo_id = huggingface_dataset_url
+    # データセットをダウンロード (再試行ロジックを追加)
+    retry_attempts = 3
+    dataset_path = None
+    for attempt in range(retry_attempts):
+        try:
+            dataset_path = snapshot_download(repo_id, repo_type="dataset", force_download=True)
+            break  # 成功した場合はループを終了
+        except OSError as e:
+            print(f"Download failed on attempt {attempt + 1}/{retry_attempts}: {e}")
+            if attempt == retry_attempts - 1:
+                raise  # 最後の試行でも失敗した場合はエラーを再送出
+            time.sleep(5)  # 少し待機して再試行
+    if dataset_path is None:
+        raise EnvironmentError("Failed to download dataset after multiple attempts.")
     # 処理対象のフォルダ
     folders = [