Spaces:

wasmdashai
/

RunTasking

Runtime error

App Files Files Community

wasmdashai commited on Jan 6

Commit

54547cf

verified ·

1 Parent(s): ef864f5

Update app.py

Browse files

Files changed (1) hide show

app.py +24 -6

app.py CHANGED Viewed

@@ -107,15 +107,32 @@ def _inference_forward_stream(
 def  get_model(name_model):
     global models
     if name_model in   models:
-        return models[name_model]
-    models[name_model]=VitsModel.from_pretrained(name_model,token=token).cuda()
     models[name_model].decoder.apply_weight_norm()
     # torch.nn.utils.weight_norm(self.decoder.conv_pre)
     # torch.nn.utils.weight_norm(self.decoder.conv_post)
     for flow in models[name_model].flow.flows:
         torch.nn.utils.weight_norm(flow.conv_pre)
         torch.nn.utils.weight_norm(flow.conv_post)
-    return models[name_model]
 zero = torch.Tensor([0]).cuda()
@@ -124,10 +141,10 @@ import torch
 TXT="""السلام  عليكم  ورحمة الله وبركاتة  يا هلا وسهلا ومراحب بالغالي  اخباركم  طيبين ان شاء الله     ارحبوا  على العين والراس     """
 @spaces.GPU
 def   modelspeech(text=TXT,name_model="wasmdashai/vits-ar-sa-huba-v2",speaking_rate=16000):
      inputs = tokenizer(text, return_tensors="pt")
-     model=get_model(name_model)
      model.speaking_rate=speaking_rate
      with torch.no_grad():
         wav=list(_inference_forward_stream(model,input_ids=inputs.input_ids.cuda(),attention_mask=inputs.attention_mask.cuda(),speaker_embeddings= None,is_streaming=False))[0]
@@ -144,7 +161,8 @@ model_choices = gr.Dropdown(
                                  "wasmdashai/vits-ar-sa-A",
                                 "wasmdashai/vits-ar-ye-sa",
-                                "wasmdashai/vits-ar-sa-M-v1"
                             ],

 def  get_model(name_model):
     global models
     if name_model in   models:
+        if  name_model=='wasmdashai/vits-en-v1':
+            tokenizer = AutoTokenizer.from_pretrained("wasmdashai/vits-en-v1",token=token)
+        else:
+            tokenizer = AutoTokenizer.from_pretrained("wasmdashai/vtk",token=token)
+        return models[name_model],tokenizer
+    models[name_model]=VitsModel.from_pretrained(name_model,token=token)
     models[name_model].decoder.apply_weight_norm()
     # torch.nn.utils.weight_norm(self.decoder.conv_pre)
     # torch.nn.utils.weight_norm(self.decoder.conv_post)
     for flow in models[name_model].flow.flows:
         torch.nn.utils.weight_norm(flow.conv_pre)
         torch.nn.utils.weight_norm(flow.conv_post)
+    if  name_model=='wasmdashai/vits-en-v1':
+            tokenizer = AutoTokenizer.from_pretrained("wasmdashai/vits-en-v1",token=token)
+    else:
+            tokenizer = AutoTokenizer.from_pretrained("wasmdashai/vtk",token=token)
+    return models[name_model],tokenizer
 zero = torch.Tensor([0]).cuda()
 TXT="""السلام  عليكم  ورحمة الله وبركاتة  يا هلا وسهلا ومراحب بالغالي  اخباركم  طيبين ان شاء الله     ارحبوا  على العين والراس     """
 @spaces.GPU
 def   modelspeech(text=TXT,name_model="wasmdashai/vits-ar-sa-huba-v2",speaking_rate=16000):
+     model,tokenizer=get_model(name_model)
      inputs = tokenizer(text, return_tensors="pt")
      model.speaking_rate=speaking_rate
      with torch.no_grad():
         wav=list(_inference_forward_stream(model,input_ids=inputs.input_ids.cuda(),attention_mask=inputs.attention_mask.cuda(),speaker_embeddings= None,is_streaming=False))[0]
                                  "wasmdashai/vits-ar-sa-A",
                                 "wasmdashai/vits-ar-ye-sa",
+                                "wasmdashai/vits-ar-sa-M-v1",
+                                'wasmdashai/vits-en-v1'
                             ],