Spaces:

FormosonBankDemos
/

Amis_ASR_transcription

Running

App Files Files Community

semakoc commited on Mar 11

Commit

0386c27

verified ·

1 Parent(s): a4c2d20

error correction

Browse files

Files changed (1) hide show

app.py +64 -4

app.py CHANGED Viewed

@@ -40,6 +40,54 @@ def transcribe_both(audio_file):
     processing_time = (datetime.now() - start_time).total_seconds()
     return transcription, transcription, processing_time
 def toggle_language(switch):
     """Switch UI text between English and Traditional Chinese"""
     if switch:
@@ -103,10 +151,22 @@ with gr.Blocks() as demo:
                  save_button, save_status, download_button]
     )
-    transcribe_button.click(transcribe_both, inputs=audio_input, outputs=[original_text, corrected_text])
-    save_button.click(store_correction, inputs=[original_text, corrected_text, audio_input, age_input, native_speaker_input], outputs=save_status)
-    download_button.click(prepare_download, inputs=[audio_input, original_text, corrected_text], outputs=download_output)
-demo.launch()

     processing_time = (datetime.now() - start_time).total_seconds()
     return transcription, transcription, processing_time
+def store_correction(original_transcription, corrected_transcription, audio_file, age, native_speaker):
+    try:
+        audio_metadata = {}
+        if audio_file and os.path.exists(audio_file):
+            audio, sr = librosa.load(audio_file, sr=16000)
+            duration = librosa.get_duration(y=audio, sr=sr)
+            file_size = os.path.getsize(audio_file)
+            audio_metadata = {'duration': duration, 'file_size': file_size}
+        combined_data = {
+            'original_text': original_transcription,
+            'corrected_text': corrected_transcription,
+            'timestamp': datetime.now().isoformat(),
+            'audio_metadata': audio_metadata,
+            'model_name': MODEL_NAME,
+            'user_info': {
+                'native_amis_speaker': native_speaker,
+                'age': age
+            }
+        }
+        db.collection('transcriptions').add(combined_data)
+        return "校正保存成功! (Correction saved successfully!)"
+    except Exception as e:
+        return f"保存失败: {e} (Error saving correction: {e})"
+def prepare_download(audio_file, original_transcription, corrected_transcription):
+    if audio_file is None:
+        return None
+    tmp_zip = tempfile.NamedTemporaryFile(delete=False, suffix=".zip")
+    tmp_zip.close()
+    with zipfile.ZipFile(tmp_zip.name, "w") as zf:
+        if os.path.exists(audio_file):
+            zf.write(audio_file, arcname="audio.wav")
+        orig_txt = "original_transcription.txt"
+        with open(orig_txt, "w", encoding="utf-8") as f:
+            f.write(original_transcription)
+        zf.write(orig_txt, arcname="original_transcription.txt")
+        os.remove(orig_txt)
+        corr_txt = "corrected_transcription.txt"
+        with open(corr_txt, "w", encoding="utf-8") as f:
+            f.write(corrected_transcription)
+        zf.write(corr_txt, arcname="corrected_transcription.txt")
+        os.remove(corr_txt)
+    return tmp_zip.name
 def toggle_language(switch):
     """Switch UI text between English and Traditional Chinese"""
     if switch:
                  save_button, save_status, download_button]
     )
+    transcribe_button.click(
+        transcribe_both,
+        inputs=audio_input,
+        outputs=[original_text, corrected_text]
+    )
+    save_button.click(
+        store_correction,
+        inputs=[original_text, corrected_text, audio_input, age_input, native_speaker_input],
+        outputs=save_status
+    )
+    download_button.click(
+        prepare_download,
+        inputs=[audio_input, original_text, corrected_text],
+        outputs=download_output
+    )
+demo.launch()