Spaces:

cpt-subtext
/

speech-to-text

Sleeping

App Files Files Community

cptsubtext commited on May 1, 2024

Commit

9f5c443

1 Parent(s): eecdc1c

fixed version

Browse files

Files changed (2) hide show

app.py +23 -19
requirements.txt +56 -2

app.py CHANGED Viewed

@@ -1,11 +1,14 @@
 import streamlit as st
 from stable_whisper import load_model
 from stable_whisper import load_hf_whisper
 import requests
 import os
 # Variables
-valid_api_token = st.secrets["API_TOKEN"]
 # Upload audio file
 uploaded_file = st.file_uploader("Upload Audio File", type=["mp3", "wav", "mov"])
@@ -24,34 +27,35 @@ def transcribe_to_subtitle(audio_bytes, model_name):
   #speedmodel = load_hf_whisper(model_name)
   # Check file size for free tier
-  if use_free_tier and len(audio_bytes) > 0.048 * 2 * 60 * 1024:
-      st.error(audio_bytes)
-      st.error("Free tier only supports audio files under 2 minutes")
-      return
   #  Transcribe audio
   try:
     result = model.transcribe(audio_bytes, verbose=True)
   except Exception as e:
      return {"error": f"Error during transcription: {str(e)}"}
-#  else:
- #   try:
-  #    result = speedmodel.transcribe(audio_bytes, verbose=True)
-   # except Exception as e:
-    #   return {"error": f"Error during transcription: {str(e)}"}
-  # Generate subtitle file
-  subtitle_text = result.text
-  with open("audio.srt", "w") as outfile:
-      outfile.write(subtitle_text)
   # Download option
   st.success("Transcription successful! Download subtitle file?")
-  if st.button("Download"):
-      st.write("Downloading...")
-      with open("audio.srt", "rb") as f:
-          st.download_button("Download Subtitle", f, "audio.srt")
-      os.remove("audio.srt")  # Remove temporary file
 if uploaded_file is not None:
   audio_bytes = uploaded_file.read()

 import streamlit as st
 from stable_whisper import load_model
 from stable_whisper import load_hf_whisper
+from pydub import AudioSegment
+import webvtt
+import pysrt
 import requests
 import os
 # Variables
+#valid_api_token = st.secrets["API_TOKEN"]
 # Upload audio file
 uploaded_file = st.file_uploader("Upload Audio File", type=["mp3", "wav", "mov"])
   #speedmodel = load_hf_whisper(model_name)
   # Check file size for free tier
+  #if use_free_tier and len(audio_bytes) > 0.048 * 2 * 60 * 1024:
+  #    st.error(len(audio_bytes))
+  #    st.error("Free tier only supports audio files under 2 minutes")
+  #    return
   #  Transcribe audio
   try:
     result = model.transcribe(audio_bytes, verbose=True)
+    result.to_srt_vtt('audio.srt')
   except Exception as e:
      return {"error": f"Error during transcription: {str(e)}"}
+  captions = pysrt.open("audio.srt")
+  for caption in captions:
+     print(caption.start)
+     print(caption.text)
+     print(caption.end)
+     print()
+  output = captions.text
+  st.markdown(output, unsafe_allow_html=True)
   # Download option
   st.success("Transcription successful! Download subtitle file?")
+  with open("audio.srt", "rb") as f:
+      st.download_button("Download Subtitle in WebVtt Format", f, "audio.srt")
+  os.remove("audio.srt")  # Remove temporary file
 if uploaded_file is not None:
   audio_bytes = uploaded_file.read()

requirements.txt CHANGED Viewed

@@ -1,2 +1,56 @@
-openai-whisper
-stable-ts

+altair==5.3.0
+attrs==23.2.0
+blinker==1.8.1
+cachetools==5.3.3
+certifi==2024.2.2
+charset-normalizer==3.3.2
+click==8.1.7
+filelock==3.14.0
+fsspec==2024.3.1
+gitdb==4.0.11
+GitPython==3.1.43
+idna==3.7
+Jinja2==3.1.3
+jsonschema==4.22.0
+jsonschema-specifications==2023.12.1
+llvmlite==0.42.0
+markdown-it-py==3.0.0
+MarkupSafe==2.1.5
+mdurl==0.1.2
+more-itertools==10.2.0
+mpmath==1.3.0
+networkx==3.3
+numba==0.59.1
+numpy==1.26.4
+openai-whisper==20231117
+packaging==24.0
+pandas==2.2.2
+pillow==10.3.0
+protobuf==4.25.3
+pyarrow==16.0.0
+pydeck==0.9.0
+Pygments==2.17.2
+python-dateutil==2.9.0.post0
+pytz==2024.1
+referencing==0.35.0
+regex==2024.4.28
+requests==2.31.0
+rich==13.7.1
+rpds-py==0.18.0
+six==1.16.0
+smmap==5.0.1
+stable-ts==2.16.0
+streamlit==1.33.0
+sympy==1.12
+tenacity==8.2.3
+tiktoken==0.6.0
+toml==0.10.2
+toolz==0.12.1
+torch==2.2.2
+torchaudio==2.2.2
+tornado==6.4
+tqdm==4.66.2
+typing_extensions==4.11.0
+tzdata==2024.1
+urllib3==2.2.1
+watchdog==4.0.0