unit-one-introduction

Running

gperdrizet commited on Jun 20

Commit

8ce33a6

verified ·

1 Parent(s): 1b00802

Added audio resampling with Scipy to match default AgentAudio sample rate.

Files changed (2) hide show

app.py CHANGED Viewed

@@ -6,6 +6,7 @@ import pytz
 import yaml
 import torch
 import soundfile as sf
 from huggingface_hub import InferenceClient
 from tools.final_answer import FinalAnswerTool
 from tools.visit_webpage import VisitWebpageTool
@@ -31,9 +32,13 @@ class TextToSpeechTool(Tool):
             model="ResembleAI/chatterbox",
         )
-        audio, _ = sf.read(io.BytesIO(output))
-        return torch.from_numpy(audio)
 @tool

 import yaml
 import torch
 import soundfile as sf
+from scipy import signal
 from huggingface_hub import InferenceClient
 from tools.final_answer import FinalAnswerTool
 from tools.visit_webpage import VisitWebpageTool
             model="ResembleAI/chatterbox",
         )
+        audio, samplerate = sf.read(io.BytesIO(output))
+        new_samplerate = 16_000
+        num_samples = int(len(audio) * new_samplerate / samplerate)
+        resampled_audio = signal.resample(audio, num_samples)
+        return torch.from_numpy(resampled_audio)
 @tool

requirements.txt CHANGED Viewed

@@ -4,5 +4,5 @@ requests
 duckduckgo_search
 pandas
 gradio==5.23.1
-transformers
-soundfile

 duckduckgo_search
 pandas
 gradio==5.23.1
+soundfile
+scipy