Spaces:

pragnakalp
/

OCR-image-to-text

Running

App Files Files Community

pragnakalp commited on Dec 2, 2022

Commit

7cd3a92

1 Parent(s): afa9234

Update app.py

Browse files

Files changed (1) hide show

app.py +13 -7

app.py CHANGED Viewed

@@ -29,15 +29,17 @@ HF_TOKEN = os.environ.get("HF_TOKEN")
 DATASET_REPO_URL = "https://huggingface.co/datasets/pragnakalp/OCR-img-to-text"
 DATA_FILENAME = "ocr_data.csv"
 DATA_FILE = os.path.join("ocr_data", DATA_FILENAME)
 HF_TOKEN = os.environ.get("HF_TOKEN")
 DATASET_REPO_ID = "pragnakalp/OCR-img-to-text"
 print("is none?", HF_TOKEN is None)
 try:
     hf_hub_download(
         repo_id=DATASET_REPO_ID,
-        filename=DATA_FILENAME,
         cache_dir=DATA_DIRNAME,
-        force_filename=DATA_FILENAME
     )
 except:
@@ -135,22 +137,26 @@ def generate_ocr(Method,img):
         imge = Image.fromarray(new_data.astype(np.uint8),'RGB')
         add_csv = [Method,imge,text_output]
         print("^^^^^",type(imge))
-        with open(DATA_FILE, "a") as f:
-            writer = csv.writer(f)
             # write the data
-            writer.writerow(add_csv)
-            commit_url = repo.push_to_hub()
-            print(commit_url)
         try:
             dataset = load_dataset("pragnakalp/OCR-img-to-text", data_files= "ocr_data.csv", streaming=True)
             print(dataset)
         except Exception as e:
             print("error in loading data",e)
         # with open(DATA_FILE, "a") as csvfile:
         #     writer = csv.Writer(csvfile)
         #     writer.writerow(add_csv)
         # commit_url = repo.push_to_hub()
         # print(commit_url)
         # save_details(Method,text_output,img)
         # sender="[email protected]"
         # password="httscgatatbbxxur"

 DATASET_REPO_URL = "https://huggingface.co/datasets/pragnakalp/OCR-img-to-text"
 DATA_FILENAME = "ocr_data.csv"
 DATA_FILE = os.path.join("ocr_data", DATA_FILENAME)
+DATA_FILENAME2 = "ocr_image"
+DATA_FILE2 = os.path.join("ocr_image", DATA_FILENAME2)
 HF_TOKEN = os.environ.get("HF_TOKEN")
 DATASET_REPO_ID = "pragnakalp/OCR-img-to-text"
 print("is none?", HF_TOKEN is None)
 try:
     hf_hub_download(
         repo_id=DATASET_REPO_ID,
+        filename=DATA_FILENAME2,
         cache_dir=DATA_DIRNAME,
+        force_filename=DATA_FILENAME2
     )
 except:
         imge = Image.fromarray(new_data.astype(np.uint8),'RGB')
         add_csv = [Method,imge,text_output]
         print("^^^^^",type(imge))
+        # with open(DATA_FILE, "a") as f:
+            # writer = csv.writer(f)
             # write the data
+            # writer.writerow(add_csv)
+        os.mkdir(DATA_FILE2)
+        commit_url = repo.push_to_hub()
+        print(commit_url)
         try:
             dataset = load_dataset("pragnakalp/OCR-img-to-text", data_files= "ocr_data.csv", streaming=True)
             print(dataset)
         except Exception as e:
             print("error in loading data",e)
         # with open(DATA_FILE, "a") as csvfile:
         #     writer = csv.Writer(csvfile)
         #     writer.writerow(add_csv)
         # commit_url = repo.push_to_hub()
         # print(commit_url)
         # save_details(Method,text_output,img)
         # sender="[email protected]"
         # password="httscgatatbbxxur"