Spaces:

unijoh
/

metaambod

Sleeping

unijoh commited on Jun 15, 2024

Commit

ed95412

verified ·

1 Parent(s): 58117da

Update tts.py

Files changed (1) hide show

tts.py CHANGED Viewed

@@ -1,18 +1,19 @@
 import torch
-from transformers import SpeechT5ForTextToSpeech, SpeechT5Processor
 import logging
 import numpy as np
 import soundfile as sf
 # Set up logging
 logging.basicConfig(level=logging.DEBUG)
-MODEL_ID = "microsoft/speecht5_tts"
 # Try to load the model and processor
 try:
-    processor = SpeechT5Processor.from_pretrained(MODEL_ID)
-    model = SpeechT5ForTextToSpeech.from_pretrained(MODEL_ID)
     logging.info("Model and processor loaded successfully.")
 except Exception as e:
     logging.error(f"Error loading model or processor: {e}")
@@ -25,7 +26,6 @@ def synthesize_speech(text):
             logging.error("Text input is empty.")
             return None
-        # Include language code explicitly if needed
         inputs = processor(text, return_tensors="pt")
         device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
         model.to(device)

 import torch
+from transformers import Wav2Vec2Processor, Wav2Vec2ForCTC
 import logging
 import numpy as np
 import soundfile as sf
+from huggingface_hub import hf_hub_download
 # Set up logging
 logging.basicConfig(level=logging.DEBUG)
+MODEL_ID = "facebook/mms-tts-fao"
 # Try to load the model and processor
 try:
+    processor = Wav2Vec2Processor.from_pretrained(MODEL_ID)
+    model = Wav2Vec2ForCTC.from_pretrained(MODEL_ID)
     logging.info("Model and processor loaded successfully.")
 except Exception as e:
     logging.error(f"Error loading model or processor: {e}")
             logging.error("Text input is empty.")
             return None
         inputs = processor(text, return_tensors="pt")
         device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
         model.to(device)