eHealth_Transcribe

Running

App Files Files Community

spriambada3 commited on Mar 19

Commit

2ce0a69

1 Parent(s): aaf2b16

add dataset

Browse files

Files changed (3) hide show

README.md +3 -3
app.py +38 -2
requirements.txt +3 -1

README.md CHANGED Viewed

@@ -1,8 +1,8 @@
 ---
-title: SOAP AI
 emoji: 👀
-colorFrom: red
-colorTo: gray
 sdk: gradio
 sdk_version: 5.17.0
 app_file: app.py

 ---
+title: eHealth Transcribe
 emoji: 👀
+colorFrom: white
+colorTo: blue
 sdk: gradio
 sdk_version: 5.17.0
 app_file: app.py

app.py CHANGED Viewed

@@ -5,6 +5,39 @@ import gradio as gr
 from google import genai
 from google.genai import types
 import asyncio
 def audio_from_bytes(audio_file_path: str):
@@ -103,7 +136,9 @@ def save_user_data(username, email):
     with open(DATA_FILE, "w") as file:
         json.dump(data, file, indent=4)
     return data
@@ -194,11 +229,12 @@ with gr.Blocks() as demo:
     user_block = gr.Column(visible=False)
     with user_block:
         counter_display = gr.Textbox(label="Status Message", interactive=False)
         gr.Interface(
             fn=transcribe_and_summarize,
             inputs=[gr.Audio(type="filepath", sources="microphone"), session],
             outputs=["text", counter_display, session],
-            description="pastikan HP/Laptop memiliki microphone untuk merekam percakapan dokter-pasien menjadi rekam medis SOAP. Akun berlangganan https://ehealth.co.id dapat terintegrasi SATUSEHAT & BPJS secara otomatis",
             allow_flagging="never",
         )
         use_case_description = gr.Markdown(

 from google import genai
 from google.genai import types
 import asyncio
+from datasets import load_dataset, DatasetDict, Dataset
+from huggingface_hub import login
+import datetime
+# Authenticate with HF token
+hf_token = os.getenv("HF_TOKEN")
+login(token=hf_token)
+dataset_name = "spriambada3/ehealth_transcribe"
+def init_dataset():
+    try:
+        dataset = load_dataset(dataset_name)
+    except Exception as e:
+        print(e)
+        dataset = DatasetDict(
+            {"data": Dataset.from_dict({"logintime": [], "email": [], "wa": []})}
+        )
+    print("init dataset result ")
+    print(dataset)
+    return dataset
+def add_user(dataset, email, wa):
+    new_data = {
+        "logintime": datetime.datetime.now(),
+        "email": email,
+        "wa": wa,
+    }
+    dataset["data"] = dataset["data"].add_item(new_data)
+    dataset.push_to_hub(dataset_name)  # Save to HF Hub
+    print("add data successful")
 def audio_from_bytes(audio_file_path: str):
     with open(DATA_FILE, "w") as file:
         json.dump(data, file, indent=4)
+    wa = username
+    dataset = init_dataset()
+    add_user(dataset, email, wa)
     return data
     user_block = gr.Column(visible=False)
     with user_block:
         counter_display = gr.Textbox(label="Status Message", interactive=False)
         gr.Interface(
             fn=transcribe_and_summarize,
             inputs=[gr.Audio(type="filepath", sources="microphone"), session],
             outputs=["text", counter_display, session],
+            description="Halo, pastikan HP/Laptop memiliki microphone untuk merekam percakapan dokter-pasien menjadi rekam medis SOAP. Akun berlangganan https://ehealth.co.id dapat terintegrasi SATUSEHAT & BPJS secara otomatis",
             allow_flagging="never",
         )
         use_case_description = gr.Markdown(

requirements.txt CHANGED Viewed

@@ -1,3 +1,5 @@
 gradio==5.17.0
 python-dotenv==1.0.1
-google-genai

 gradio==5.17.0
 python-dotenv==1.0.1
+google-genai
+huggingface_hub
+datasets