Spaces:

morsczx
/

asr_pipeline

Sleeping

Manjot Singh commited on Sep 7, 2024

Commit

bae6026

1 Parent(s): 4a17bd1

changed compute type

Files changed (1) hide show

audio_processing.py CHANGED Viewed

@@ -12,7 +12,7 @@ from difflib import SequenceMatcher
 hf_token = os.getenv("HF_TOKEN")
 CHUNK_LENGTH=10
-OVERLAP=2
 import whisperx
 import torch
 import numpy as np
@@ -21,6 +21,8 @@ logger = logging.getLogger(__name__)
 import spaces
 def preprocess_audio(audio, chunk_size=CHUNK_LENGTH*16000, overlap=OVERLAP*16000):  # 2 seconds overlap
     chunks = []
     for i in range(0, len(audio), chunk_size - overlap):
@@ -37,7 +39,7 @@ def process_audio(audio_file, translate=False, model_size="small"):
     try:
         device = "cuda" if torch.cuda.is_available() else "cpu"
         print(f"Using device: {device}")
-        compute_type = "float32"
         audio = whisperx.load_audio(audio_file)
         model = whisperx.load_model(model_size, device, compute_type=compute_type)

 hf_token = os.getenv("HF_TOKEN")
 CHUNK_LENGTH=10
+OVERLAP=0
 import whisperx
 import torch
 import numpy as np
 import spaces
 def preprocess_audio(audio, chunk_size=CHUNK_LENGTH*16000, overlap=OVERLAP*16000):  # 2 seconds overlap
     chunks = []
     for i in range(0, len(audio), chunk_size - overlap):
     try:
         device = "cuda" if torch.cuda.is_available() else "cpu"
         print(f"Using device: {device}")
+        compute_type = torch.bfloat16 if torch.cuda.is_available() else "float32"
         audio = whisperx.load_audio(audio_file)
         model = whisperx.load_model(model_size, device, compute_type=compute_type)