Spaces:

canksdi
/

cancan

Sleeping

App Files Files Community

canksdi commited on Mar 21

Commit

39d7dde

verified ·

1 Parent(s): 8147ea3

Upload 3 files

Browse files

Files changed (3) hide show

README.md +8 -7
app.py +25 -41
requirements.txt +2 -2

README.md CHANGED Viewed

@@ -11,27 +11,27 @@ pinned: false
 # MoodF - Duygusal Destek Asistanı
-Bu uygulama, kullanıcıların duygusal durumlarını analiz edip destekleyici yanıtlar veren ve bunları insan sesine yakın bir sesle seslendiren gelişmiş bir yapay zeka asistanıdır.
 ## Özellikler
 - 🧠 **Duygu analizi** - Kullanıcının yazısındaki duygu durumunu tespit eder
 - 💬 **Gerçek zamanlı metin üretimi** - Türkçe dil modeli kullanarak özgün destekleyici mesajlar üretir
-- 🔊 **İnsan sesine yakın seslendirme** - SpeechT5 modeli ile doğal sesli yanıtlar üretir
 ## Nasıl Kullanılır
 1. Duygularınızı veya düşüncelerinizi metin kutusuna yazın
 2. "Gönder" düğmesine tıklayın
-3. MoodF size özgün bir destekleyici yanıt verecek ve bunu insan sesine yakın bir şekilde seslendirecektir
 ## Teknik Detaylar
-Bu proje üç farklı yapay zeka modelini bir araya getirir:
 - **Duygu Analizi**: DistilBERT modeli
 - **Metin Üretme**: ytu-ce-cosmos/turkish-gpt2 - Yıldız Teknik Üniversitesi tarafından Türkçe dili için özel olarak eğitilmiş metin üretme modeli
-- **Seslendirme**: Microsoft SpeechT5 - İnsan sesine çok yakın doğal seslendirme yapan gelişmiş TTS modeli
 ## API Kullanımı
@@ -58,11 +58,12 @@ Yanıt olarak metin ve ses dosyası URL'si alınır.
 ```
 gradio==3.32.0
 transformers==4.30.2
-torch==2.0.1
 soundfile==0.12.1
 datasets==2.13.0
-numpy>=1.17.0
 protobuf==3.20.3
 tqdm
 sentencepiece
 ```

 # MoodF - Duygusal Destek Asistanı
+Bu uygulama, kullanıcıların duygusal durumlarını analiz edip destekleyici yanıtlar veren ve bunları gerçek insan sesine yakın bir kalitede seslendiren gelişmiş bir yapay zeka asistanıdır.
 ## Özellikler
 - 🧠 **Duygu analizi** - Kullanıcının yazısındaki duygu durumunu tespit eder
 - 💬 **Gerçek zamanlı metin üretimi** - Türkçe dil modeli kullanarak özgün destekleyici mesajlar üretir
+- 🔊 **İnsan benzeri ses** - Meta AI tarafından geliştirilen VITS teknolojisi ile doğal insan sesine çok yakın kalitede seslendirme
 ## Nasıl Kullanılır
 1. Duygularınızı veya düşüncelerinizi metin kutusuna yazın
 2. "Gönder" düğmesine tıklayın
+3. MoodF size özgün bir destekleyici yanıt verecek ve bunu gerçeğe çok yakın bir sesle seslendirecektir
 ## Teknik Detaylar
+Bu proje iki farklı yapay zeka modelini ve Meta'nın ses teknolojisini bir araya getirir:
 - **Duygu Analizi**: DistilBERT modeli
 - **Metin Üretme**: ytu-ce-cosmos/turkish-gpt2 - Yıldız Teknik Üniversitesi tarafından Türkçe dili için özel olarak eğitilmiş metin üretme modeli
+- **Seslendirme**: XTTS v2 (Coqui TTS) - Meta AI teknolojisiyle geliştirilmiş, insan sesine çok yakın kalitede çokdilli seslendirme yapan gelişmiş model
 ## API Kullanımı
 ```
 gradio==3.32.0
 transformers==4.30.2
+torch==2.0.0
 soundfile==0.12.1
 datasets==2.13.0
+numpy<2.0.0
 protobuf==3.20.3
 tqdm
 sentencepiece
+TTS
 ```

app.py CHANGED Viewed

@@ -1,12 +1,9 @@
 import gradio as gr
 from transformers import pipeline, AutoModelForCausalLM, AutoTokenizer
-from transformers import SpeechT5Processor, SpeechT5ForTextToSpeech, SpeechT5HifiGan
 import torch
-import soundfile as sf
-from datasets import load_dataset
-import numpy as np
 import os
 import time
 # Daha az bellek kullanımı için
 torch.set_grad_enabled(False)
@@ -24,16 +21,11 @@ tokenizer = AutoTokenizer.from_pretrained("ytu-ce-cosmos/turkish-gpt2")
 text_model = AutoModelForCausalLM.from_pretrained("ytu-ce-cosmos/turkish-gpt2")
 print("Metin modeli yüklendi.")
-# Yüksek kaliteli SpeechT5 TTS modeli
-print("SpeechT5 modeli yükleniyor...")
-processor = SpeechT5Processor.from_pretrained("microsoft/speecht5_tts")
-tts_model = SpeechT5ForTextToSpeech.from_pretrained("microsoft/speecht5_tts")
-vocoder = SpeechT5HifiGan.from_pretrained("microsoft/speecht5_hifigan")
-print("SpeechT5 modeli yüklendi.")
-# Konuşmacı embedding'i al - kadın sesi
-embeddings_dataset = load_dataset("Matthijs/cmu-arctic-xvectors", split="validation")
-speaker_embeddings = torch.tensor(embeddings_dataset[7306]["xvector"]).unsqueeze(0)  # Kadın ses
 def generate_turkish_text(prompt, max_length=100):
     """Türkçe metin üretme fonksiyonu"""
@@ -53,21 +45,21 @@ def generate_turkish_text(prompt, max_length=100):
     return generated_text
 def create_speech(text):
-    """Yüksek kaliteli konuşma üretme fonksiyonu"""
-    # Metni işle
-    inputs = processor(text=text, return_tensors="pt")
-    # Ses üret
-    speech = tts_model.generate_speech(
-        inputs["input_ids"],
-        speaker_embeddings,
-        vocoder=vocoder
-    )
-    # Numpy dizisine dönüştür
-    speech_np = speech.numpy()
-    return speech_np
 def process_input(text):
     try:
@@ -100,17 +92,9 @@ def process_input(text):
         print(f"Üretilen yanıt: {response[:50]}...")
-        # Yüksek kaliteli ses üret
-        print("Yüksek kaliteli ses dosyası oluşturuluyor...")
-        audio_path = "response.wav"
-        # Türkçe metni İngilizce telaffuz edebilecek hale getir
-        # SpeechT5 sadece İngilizce için eğitilmiş, bu yüzden bir miktar uyarlama gerekiyor
-        response_for_speech = response
-        # Sesi oluştur ve kaydet
-        speech_array = create_speech(response_for_speech)
-        sf.write(audio_path, speech_array, 16000)
         print(f"İşlem tamamlandı ({time.time() - start_time:.2f} saniye)")
@@ -131,7 +115,7 @@ Bu uygulama yapay zeka kullanarak duygularınızı analiz eder ve size destekley
 **Nasıl kullanılır:**
 1. Nasıl hissettiğinizi yazın
 2. "Gönder" düğmesine tıklayın
-3. MoodF'in yazılı ve sesli yanıtını alın
 """
 # Arayüz tasarımı

 import gradio as gr
 from transformers import pipeline, AutoModelForCausalLM, AutoTokenizer
 import torch
 import os
 import time
+from TTS.api import TTS
 # Daha az bellek kullanımı için
 torch.set_grad_enabled(False)
 text_model = AutoModelForCausalLM.from_pretrained("ytu-ce-cosmos/turkish-gpt2")
 print("Metin modeli yüklendi.")
+# TTS modeli yükleniyor
+print("TTS modeli yükleniyor...")
+# Facebook/Meta'nın yüksek kaliteli kadın sesi modelini kullanacağız
+tts = TTS("tts_models/multilingual/multi-dataset/xtts_v2")
+print("TTS modeli yüklendi.")
 def generate_turkish_text(prompt, max_length=100):
     """Türkçe metin üretme fonksiyonu"""
     return generated_text
 def create_speech(text):
+    """Facebook/Meta'nın VITS modeli ile doğal insan sesi üret"""
+    try:
+        audio_path = "response.wav"
+        # Türkçe metin için yüksek kaliteli doğal ses sentezi
+        # speaker_wav seçeneği yoksa basit halini kullanıyoruz
+        tts.tts_to_file(text=text, file_path=audio_path, language="tr")
+        return audio_path
+    except Exception as e:
+        print(f"Ses oluşturma hatası: {str(e)}")
+        # Hata durumunda log al
+        print(f"Detaylı hata: {e}")
+        # Boş ses dosyası oluştur
+        with open("empty.wav", "wb") as f:
+            f.write(b"")
+        return "empty.wav"
 def process_input(text):
     try:
         print(f"Üretilen yanıt: {response[:50]}...")
+        # Yüksek kaliteli doğal ses üret
+        print("Doğal ses üretiliyor...")
+        audio_path = create_speech(response)
         print(f"İşlem tamamlandı ({time.time() - start_time:.2f} saniye)")
 **Nasıl kullanılır:**
 1. Nasıl hissettiğinizi yazın
 2. "Gönder" düğmesine tıklayın
+3. MoodF'in yazılı ve doğal sesli yanıtını alın
 """
 # Arayüz tasarımı

requirements.txt CHANGED Viewed

@@ -1,10 +1,10 @@
 gradio==3.32.0
 transformers==4.30.2
 torch==2.0.0
-torchaudio==2.0.1
 soundfile==0.12.1
 datasets==2.13.0
 numpy<2.0.0
 protobuf==3.20.3
 tqdm
-sentencepiece

 gradio==3.32.0
 transformers==4.30.2
 torch==2.0.0
 soundfile==0.12.1
 datasets==2.13.0
 numpy<2.0.0
 protobuf==3.20.3
 tqdm
+sentencepiece
+TTS