Spaces:

habib-z
/

gradio-tts

Runtime error

App Files Files Community

habib-z commited on Jun 9, 2024

Commit

cae728b

1 Parent(s): deb512f

first commit clone persian tts

Browse files

Files changed (5) hide show

.gitattributes +1 -1
README.md +6 -5
app.py +115 -0
packages.txt +2 -0
requirements.txt +1 -0

.gitattributes CHANGED Viewed

@@ -25,7 +25,6 @@
 *.safetensors filter=lfs diff=lfs merge=lfs -text
 saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.tar.* filter=lfs diff=lfs merge=lfs -text
-*.tar filter=lfs diff=lfs merge=lfs -text
 *.tflite filter=lfs diff=lfs merge=lfs -text
 *.tgz filter=lfs diff=lfs merge=lfs -text
 *.wasm filter=lfs diff=lfs merge=lfs -text
@@ -33,3 +32,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.safetensors filter=lfs diff=lfs merge=lfs -text
 saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.tar.* filter=lfs diff=lfs merge=lfs -text
 *.tflite filter=lfs diff=lfs merge=lfs -text
 *.tgz filter=lfs diff=lfs merge=lfs -text
 *.wasm filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+best_model.pth filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -1,12 +1,13 @@
 ---
-title: Gradio Tts
-emoji: ⚡
-colorFrom: red
-colorTo: purple
 sdk: gradio
-sdk_version: 4.36.0
 app_file: app.py
 pinned: false
 ---
 Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 ---
+title: Persian Tts CoquiTTS
+emoji: 🚀
+colorFrom: green
+colorTo: blue
 sdk: gradio
+sdk_version: 3.15.0
 app_file: app.py
 pinned: false
+license: openrail
 ---
 Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

app.py ADDED Viewed

	@@ -0,0 +1,115 @@

+import tempfile ,os
+from TTS.config import load_config
+import gradio as gr
+from TTS.utils.manage import ModelManager
+from TTS.utils.synthesizer import Synthesizer
+MODEL_NAMES=[
+    "vits male1 (best)",
+    "vits female (best)",
+    "vits-male",
+    "vits female1",
+    "glowtts-male",
+    "glowtts-female",
+    "female tacotron2"
+]
+MAX_TXT_LEN = 800
+model_path = os.getcwd() + "/best_model.pth"
+config_path = os.getcwd() + "/config.json"
+from TTS.utils.download import download_url
+modelInfo=[
+    ["vits-male","best_model_65633.pth","config-0.json","https://huggingface.co/Kamtera/persian-tts-male-vits/resolve/main/"],
+    ["vits female (best)","checkpoint_48000.pth","config-2.json","https://huggingface.co/Kamtera/persian-tts-female-vits/resolve/main/"],
+    ["glowtts-male","best_model_77797.pth","config-1.json","https://huggingface.co/Kamtera/persian-tts-male-glow_tts/resolve/main/"],
+    ["glowtts-female","best_model.pth","config.json","https://huggingface.co/Kamtera/persian-tts-female-glow_tts/resolve/main/"],
+    ["vits male1 (best)","checkpoint_88000.pth","config.json","https://huggingface.co/Kamtera/persian-tts-male1-vits/resolve/main/"],
+    ["vits female1","checkpoint_50000.pth","config.json","https://huggingface.co/Kamtera/persian-tts-female1-vits/resolve/main/"],
+    ["female tacotron2","checkpoint_313000.pth","config-2.json","https://huggingface.co/Kamtera/persian-tts-female-tacotron2/resolve/main/"]
+]
+for d in modelInfo:
+    directory=d[0]
+    if not os.path.exists(directory):
+        os.makedirs(directory)
+    print("|> Downloading: ",directory)
+    download_url(
+        d[3]+d[1],directory,"best_model.pth"
+    )
+    download_url(
+        d[3]+d[2],directory,"config.json"
+    )
+def tts(text: str,model_name: str):
+    if len(text) > MAX_TXT_LEN:
+        text = text[:MAX_TXT_LEN]
+        print(f"Input text was cutoff since it went over the {MAX_TXT_LEN} character limit.")
+    print(text)
+    # synthesize
+    synthesizer = Synthesizer(
+        model_name+"/best_model.pth", model_name+"/config.json"
+    )
+    if synthesizer is None:
+        raise NameError("model not found")
+    wavs = synthesizer.tts(text)
+    # return output
+    with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as fp:
+        synthesizer.save_wav(wavs, fp)
+        return fp.name
+description="""
+This is a demo of persian text to speech model.
+**Github : https://github.com/karim23657/Persian-tts-coqui  **
+Models can be found here:  <br>
+|Model|Dataset|
+|----|------|
+|[vits female (best)](https://huggingface.co/Kamtera/persian-tts-female-vits)|[persian-tts-dataset-famale](https://www.kaggle.com/datasets/magnoliasis/persian-tts-dataset-famale)|
+|[vits male1 (best)](https://huggingface.co/Kamtera/persian-tts-male1-vits)|[persian-tts-dataset-male](https://www.kaggle.com/datasets/magnoliasis/persian-tts-dataset-male)|
+|[vits female1](https://huggingface.co/Kamtera/persian-tts-female1-vits)|[ParsiGoo](https://github.com/karim23657/ParsiGoo)|
+|[vits male](https://huggingface.co/Kamtera/persian-tts-male-vits)|[persian-tts-dataset](https://www.kaggle.com/datasets/magnoliasis/persian-tts-dataset)|
+|[glowtts female](https://huggingface.co/Kamtera/persian-tts-female-glow_tts)|[persian-tts-dataset-famale](https://www.kaggle.com/datasets/magnoliasis/persian-tts-dataset-famale)|
+|[glowtts male](https://huggingface.co/Kamtera/persian-tts-male-glow_tts)|[persian-tts-dataset](https://www.kaggle.com/datasets/magnoliasis/persian-tts-dataset)|
+|[tacotron2 female](https://huggingface.co/Kamtera/persian-tts-female-tacotron2)|[persian-tts-dataset-famale](https://www.kaggle.com/datasets/magnoliasis/persian-tts-dataset-famale)|
+"""
+article= ""
+examples=[
+    ["و خداوند شما را با ارسال روح در جسم زندگانی و حیات بخشید","vits-male"],
+    ["تاجر تو چه تجارت می کنی ، تو را چه که چه تجارت می کنم؟","vits female (best)"],
+    ["شیش سیخ جیگر سیخی شیش هزار","vits female (best)"],
+    ["سه شیشه شیر ، سه سیر سرشیر","vits female (best)"],
+    ["دزدی دزدید ز بز دزدی بزی ، عجب دزدی که دزدید ز بز دزدی بزی","vits male1 (best)"],
+    ["مثنوی یکی از قالب های شعری است ک هر بیت قافیه ی جداگانه دارد","vits female1"],
+    ["در گلو ماند خس او سالها، چیست آن خس مهر جاه و مالها","vits male1 (best)"],
+]
+iface = gr.Interface(
+    fn=tts,
+    inputs=[
+        gr.Textbox(
+            label="Text",
+            value="زندگی فقط یک بار است؛ از آن به خوبی استفاده کن",
+        ),
+        gr.Radio(
+            label="Pick a TTS Model ",
+            choices=MODEL_NAMES,
+            value="vits-female",
+        ),
+    ],
+    outputs=gr.Audio(label="Output",type='filepath'),
+    examples=examples,
+    title="🗣️ Persian tts 🗣️",
+    description=description,
+    article=article,
+    live=False
+)
+iface.launch(share=False)

packages.txt ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ libsndfile1
2	+ espeak-ng

requirements.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ git+https://github.com/coqui-ai/TTS@dev#egg=TTS