asr-inference

Running on Zero

Ankush Rana commited on Apr 17, 2024

Commit

18b7be0

1 Parent(s): ff06d12

resample with torchaudio

Files changed (1) hide show

whisper2.py CHANGED Viewed

@@ -33,9 +33,9 @@ def change_formate(input_file):
 def generate(audio):
-    audio = change_formate(audio)
     input_audio, sample_rate = torchaudio.load(audio)
     #metadata = torchaudio.info(audio)
     #length1 = math.ceil(metadata.num_frames / metadata.sample_rate)
     length = librosa.get_duration(path=audio)
@@ -109,4 +109,5 @@ def generate(audio):
     if length <= 30:
         return output[1:]
     else:
-        return output[0]

 def generate(audio):
+    # audio = change_formate(audio)
     input_audio, sample_rate = torchaudio.load(audio)
+    input_audio = torchaudio.transforms.Resample(sample_rate, 16000)(input_audio)
     #metadata = torchaudio.info(audio)
     #length1 = math.ceil(metadata.num_frames / metadata.sample_rate)
     length = librosa.get_duration(path=audio)
     if length <= 30:
         return output[1:]
     else:
+        return output[0]