Spaces:

snackshell
/

selam-tts

Sleeping

App Files Files Community

snackshell commited on 9 days ago

Commit

e8ac110

verified ·

1 Parent(s): b1772e2

Upload 5 files

Browse files

Files changed (5) hide show

.gitattributes +35 -35
LICENSE +21 -0
app.py +105 -0
assets/demo.png +0 -0
requirements.txt +5 -0

.gitattributes CHANGED Viewed

@@ -1,35 +1,35 @@
-*.7z filter=lfs diff=lfs merge=lfs -text
-*.arrow filter=lfs diff=lfs merge=lfs -text
-*.bin filter=lfs diff=lfs merge=lfs -text
-*.bz2 filter=lfs diff=lfs merge=lfs -text
-*.ckpt filter=lfs diff=lfs merge=lfs -text
-*.ftz filter=lfs diff=lfs merge=lfs -text
-*.gz filter=lfs diff=lfs merge=lfs -text
-*.h5 filter=lfs diff=lfs merge=lfs -text
-*.joblib filter=lfs diff=lfs merge=lfs -text
-*.lfs.* filter=lfs diff=lfs merge=lfs -text
-*.mlmodel filter=lfs diff=lfs merge=lfs -text
-*.model filter=lfs diff=lfs merge=lfs -text
-*.msgpack filter=lfs diff=lfs merge=lfs -text
-*.npy filter=lfs diff=lfs merge=lfs -text
-*.npz filter=lfs diff=lfs merge=lfs -text
-*.onnx filter=lfs diff=lfs merge=lfs -text
-*.ot filter=lfs diff=lfs merge=lfs -text
-*.parquet filter=lfs diff=lfs merge=lfs -text
-*.pb filter=lfs diff=lfs merge=lfs -text
-*.pickle filter=lfs diff=lfs merge=lfs -text
-*.pkl filter=lfs diff=lfs merge=lfs -text
-*.pt filter=lfs diff=lfs merge=lfs -text
-*.pth filter=lfs diff=lfs merge=lfs -text
-*.rar filter=lfs diff=lfs merge=lfs -text
-*.safetensors filter=lfs diff=lfs merge=lfs -text
-saved_model/**/* filter=lfs diff=lfs merge=lfs -text
-*.tar.* filter=lfs diff=lfs merge=lfs -text
-*.tar filter=lfs diff=lfs merge=lfs -text
-*.tflite filter=lfs diff=lfs merge=lfs -text
-*.tgz filter=lfs diff=lfs merge=lfs -text
-*.wasm filter=lfs diff=lfs merge=lfs -text
-*.xz filter=lfs diff=lfs merge=lfs -text
-*.zip filter=lfs diff=lfs merge=lfs -text
-*.zst filter=lfs diff=lfs merge=lfs -text
-*tfevents* filter=lfs diff=lfs merge=lfs -text

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

LICENSE ADDED Viewed

	@@ -0,0 +1,21 @@

+MIT License
+Copyright (c) 2025 Snackshell
+Permission is hereby granted, free of charge, to any person obtaining a copy
+of this software and associated documentation files (the "Software"), to deal
+in the Software without restriction, including without limitation the rights
+to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
+copies of the Software, and to permit persons to whom the Software is
+furnished to do so, subject to the following conditions:
+The above copyright notice and this permission notice shall be included in all
+copies or substantial portions of the Software.
+THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
+AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
+OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
+SOFTWARE.

app.py ADDED Viewed

	@@ -0,0 +1,105 @@

+import tempfile
+import edge_tts
+import gradio as gr
+import asyncio
+# --- Final, VERIFIED Language & Voice Configuration ---
+language_dict = {
+    "English": {
+        "Jenny (Female, US)": "en-US-JennyNeural",
+        "Andrew (Male, US)": "en-US-AndrewNeural",
+        "Sonia (Female, UK)": "en-GB-SoniaNeural",
+        "Ryan (Male, UK)": "en-GB-RyanNeural"
+    },
+    "Amharic": {
+        "Mekdes (Female)": "am-ET-MekdesNeural",
+        "Ameha (Male)": "am-ET-AmehaNeural"
+    },
+    "Tigrinya": {
+        # WORKAROUND: Using Amharic voices as a fallback for Tigrinya.
+        "Lulia (Female)": "am-ET-MekdesNeural",
+        "Birhane (Male)": "am-ET-AmehaNeural"
+    },
+    "Arabic": {
+        "Zariyah (Female, KSA)": "ar-SA-ZariyahNeural",
+        "Hamed (Male, KSA)": "ar-SA-HamedNeural"
+    },
+    "French": {
+        "Denise (Female)": "fr-FR-DeniseNeural",
+        "Henri (Male)": "fr-FR-HenriNeural"
+    },
+    "German": {
+        "Katja (Female)": "de-DE-KatjaNeural",
+        "Conrad (Male)": "de-DE-ConradNeural"
+    },
+    "Italian": {
+        "Elsa (Female)": "it-IT-ElsaNeural",
+        "Diego (Male)": "it-IT-DiegoNeural"
+    },
+    "Japanese": {
+        "Nanami (Female)": "ja-JP-NanamiNeural",
+        "Keita (Male)": "ja-JP-KeitaNeural"
+    },
+    "Korean": {
+        "Sun-Hi (Female)": "ko-KR-SunHiNeural",
+        "InJoon (Male)": "ko-KR-InJoonNeural"
+    },
+    "Chinese (Simplified)": {
+        "Xiaoxiao (Female)": "zh-CN-XiaoxiaoNeural",
+        "Yunxi (Male)": "zh-CN-YunxiNeural"
+    },
+    "Chinese (Traditional)": {
+        "HsiaoChen (Female)": "zh-TW-HsiaoChenNeural",
+        "YunJhe (Male)": "zh-TW-YunJheNeural"
+    }
+}
+async def text_to_speech_edge(text, language, speaker):
+    try:
+        voice = language_dict[language][speaker]
+    except KeyError:
+        raise gr.Error(f"Error: Voice '{speaker}' not found for {language}.")
+    try:
+        communicate = edge_tts.Communicate(text, voice)
+        with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as tmp_file:
+            tmp_path = tmp_file.name
+            await asyncio.wait_for(communicate.save(tmp_path), timeout=60)
+        return tmp_path
+    except asyncio.TimeoutError:
+        raise gr.Error("Error: Request timed out. Please try again.")
+    except Exception as e:
+        raise gr.Error(f"An unexpected error occurred: {str(e)}")
+def update_speakers(language):
+    speakers = list(language_dict.get(language, []))
+    return gr.Dropdown(choices=speakers, value=speakers[0] if speakers else None, interactive=True)
+# --- Gradio Interface ---
+with gr.Blocks(title="SelamGPT TTS", theme=gr.themes.Soft()) as demo:
+    gr.Markdown("# SelamGPT Text-to-Speech")
+    with gr.Row():
+        language = gr.Dropdown(
+            choices=list(language_dict.keys()),
+            value="Amharic",
+            label="Language"
+        )
+        speaker = gr.Dropdown(
+            label="Speaker",
+            choices=list(language_dict["Amharic"].keys()),
+            value="Mekdes (Female)"
+        )
+    with gr.Column():
+        input_text = gr.Textbox(label="Input Text", placeholder="Enter text here...")
+        generate_btn = gr.Button("Generate Audio", variant="primary")
+    output_audio = gr.Audio(label="Output Audio", autoplay=True)
+    language.change(fn=update_speakers, inputs=language, outputs=speaker)
+    generate_btn.click(fn=text_to_speech_edge, inputs=[input_text, language, speaker], outputs=output_audio)
+if __name__ == "__main__":
+    demo.launch()

assets/demo.png ADDED Viewed

requirements.txt ADDED Viewed

	@@ -0,0 +1,5 @@

+gradio
+edge-tts
+pyarabic
+gradio-client
+transformers