Spaces:

StevenChen16
/

WhisperX-V2

Build error

StevenChen16 commited on Nov 13, 2024

Commit

67d22ff

verified ·

1 Parent(s): 589b5f5

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,28 +1,32 @@
 import torch
 import whisperx
 import gradio as gr
 # 检测设备类型
 device = "cuda" if torch.cuda.is_available() else "cpu"
-# 设置计算类型
 compute_type = "float16" if device == "cuda" else "int8"
 # 加载 WhisperX 模型
-model = whisperx.load_model("large-v3", device=device, compute_type=compute_type)
 def transcribe(audio_path):
-    # 使用WhisperX进行转录
     result = model.transcribe(audio_path)
     return result['text']
-# 创建Gradio接口
 iface = gr.Interface(
     fn=transcribe,
-    inputs=gr.Audio(sources=["upload", "microphone"], type="filepath"),
     outputs="text",
     title="WhisperX 语音转文字",
-    description="上传音频文件，使用WhisperX模型进行转录。"
 )
 if __name__ == "__main__":

 import torch
 import whisperx
 import gradio as gr
+import spaces
 # 检测设备类型
 device = "cuda" if torch.cuda.is_available() else "cpu"
 compute_type = "float16" if device == "cuda" else "int8"
+@spaces.GPU  # 确保在 GPU 环境下运行
+def load_model():
+    # 在 GPU 可用时加载模型
+    return whisperx.load_model("large-v3", device=device, compute_type=compute_type)
 # 加载 WhisperX 模型
+model = load_model()
 def transcribe(audio_path):
+    # 使用 WhisperX 进行转录
     result = model.transcribe(audio_path)
     return result['text']
+# 创建 Gradio 接口
 iface = gr.Interface(
     fn=transcribe,
+    inputs=gr.Audio(source=["upload","microphone"], type="filepath"),
     outputs="text",
     title="WhisperX 语音转文字",
+    description="上传音频文件，使用 WhisperX 模型进行转录。"
 )
 if __name__ == "__main__":