Spaces:

canksdi
/

cancan

Sleeping

App Files Files Community

canksdi commited on Mar 21

Commit

c9f6731

verified ·

1 Parent(s): e20ecea

Upload 3 files

Browse files

Files changed (3) hide show

README.md +68 -41
app.py +43 -10
requirements.txt +3 -3

README.md CHANGED Viewed

@@ -1,41 +1,68 @@
----
-title: MoodF - Duygusal Destek Asistanı
-emoji: 🔥
-colorFrom: blue
-colorTo: purple
-sdk: gradio
-sdk_version: 5.22.0
-app_file: app.py
-pinned: false
-license: apache-2.0
----
-# MoodF - Duygusal Destek Asistanı
-Bu uygulama, kullanıcıların duygusal durumlarını analiz edip destekleyici yanıtlar veren bir yapay zeka asistanıdır.
-## Özellikler
-- 🧠 Duygu analizi - Kullanıcının yazısındaki duygu durumunu tespit eder
-- 💬 Destekleyici mesajlar - Kullanıcı üzgünse veya olumsuz hissettiğinde motive edici cevaplar üretir
-- 🔊 Sesli yanıt - Üretilen cevapları sesli olarak sunar
-## Nasıl Kullanılır
-1. Duygularınızı veya düşüncelerinizi metin kutusuna yazın
-2. "Gönder" düğmesine basın
-3. MoodF size destek olacak bir yanıt verecek ve yanıtı seslendirecektir
-## Teknik Detaylar
-Bu proje üç farklı yapay zeka modelini bir araya getirir:
-- **Duygu Analizi**: CardiffNLP Twitter RoBERTa modeli
-- **Metin Üretme**: Mistral-7B-Instruct modeli
-- **Seslendirme**: Tacotron2-DDC modeli
-## Kurulum
-```bash
-pip install -r requirements.txt
-python app.py
-```

+---
+title: MoodF - Duygusal Destek Asistanı
+emoji: 😊
+colorFrom: blue
+colorTo: purple
+sdk: gradio
+sdk_version: "3.32.0"
+app_file: app.py
+pinned: false
+---
+# MoodF - Duygusal Destek Asistanı
+Bu uygulama, kullanıcıların duygusal durumlarını analiz edip destekleyici yanıtlar veren ve bunları insan sesine yakın bir sesle seslendiren gelişmiş bir yapay zeka asistanıdır.
+## Özellikler
+- 🧠 **Duygu analizi** - Kullanıcının yazısındaki duygu durumunu tespit eder
+- 💬 **Gerçek zamanlı metin üretimi** - Türkçe dil modeli kullanarak özgün destekleyici mesajlar üretir
+- 🔊 **İnsan sesine yakın seslendirme** - SpeechT5 modeli ile doğal sesli yanıtlar üretir
+## Nasıl Kullanılır
+1. Duygularınızı veya düşüncelerinizi metin kutusuna yazın
+2. "Gönder" düğmesine tıklayın
+3. MoodF size özgün bir destekleyici yanıt verecek ve bunu insan sesine yakın bir şekilde seslendirecektir
+## Teknik Detaylar
+Bu proje üç farklı yapay zeka modelini bir araya getirir:
+- **Duygu Analizi**: DistilBERT modeli
+- **Metin Üretme**: dbmdz/turkish-gpt2 - Türkçe dili için özel olarak eğitilmiş metin üretme modeli
+- **Seslendirme**: Microsoft SpeechT5 - İnsan sesine çok yakın doğal seslendirme yapan gelişmiş TTS modeli
+## API Kullanımı
+Bu Space, API endpoint'i üzerinden erişilebilir:
+```
+https://huggingface.co/spaces/canksdi/cancan/api/predict/
+```
+POST isteği ile şu formatta veri gönderilebilir:
+```json
+{
+  "data": ["Bugün kendimi çok kötü hissediyorum."]
+}
+```
+Yanıt olarak metin ve ses dosyası URL'si alınır.
+## Kurulum
+### Bağımlılıklar:
+```
+gradio==3.32.0
+transformers==4.30.2
+torch==2.0.1
+soundfile==0.12.1
+datasets==2.13.0
+numpy>=1.17.0
+protobuf==3.20.3
+tqdm
+sentencepiece
+```

app.py CHANGED Viewed

@@ -1,7 +1,10 @@
 import gradio as gr
 from transformers import pipeline, AutoModelForCausalLM, AutoTokenizer
 import torch
-from TTS.api import TTS
 import os
 import time
@@ -15,16 +18,22 @@ sentiment_model = pipeline(
     device=-1  # CPU üzerinde çalıştır
 )
-# Türkçe Metin Üretme Modeli - Türkçe destekleyen bir model
 print("Metin üretme modeli yükleniyor...")
 tokenizer = AutoTokenizer.from_pretrained("dbmdz/turkish-gpt2")
 text_model = AutoModelForCausalLM.from_pretrained("dbmdz/turkish-gpt2")
-print("Model yüklendi.")
-# Daha profesyonel TTS modeli
-print("TTS modeli yükleniyor...")
-tts_model = TTS(model_name="tts_models/tr/common-voice/glow-tts")
-print("TTS modeli yüklendi.")
 def generate_turkish_text(prompt, max_length=100):
     """Türkçe metin üretme fonksiyonu"""
@@ -43,6 +52,23 @@ def generate_turkish_text(prompt, max_length=100):
         generated_text = generated_text[len(prompt):].strip()
     return generated_text
 def process_input(text):
     try:
         if not text or text.strip() == "":
@@ -74,10 +100,17 @@ def process_input(text):
         print(f"Üretilen yanıt: {response[:50]}...")
-        # Yüksek kaliteli TTS ile seslendirme yap
-        print("Ses dosyası oluşturuluyor...")
         audio_path = "response.wav"
-        tts_model.tts_to_file(text=response, file_path=audio_path)
         print(f"İşlem tamamlandı ({time.time() - start_time:.2f} saniye)")

 import gradio as gr
 from transformers import pipeline, AutoModelForCausalLM, AutoTokenizer
+from transformers import SpeechT5Processor, SpeechT5ForTextToSpeech, SpeechT5HifiGan
 import torch
+import soundfile as sf
+from datasets import load_dataset
+import numpy as np
 import os
 import time
     device=-1  # CPU üzerinde çalıştır
 )
+# Türkçe Metin Üretme Modeli
 print("Metin üretme modeli yükleniyor...")
 tokenizer = AutoTokenizer.from_pretrained("dbmdz/turkish-gpt2")
 text_model = AutoModelForCausalLM.from_pretrained("dbmdz/turkish-gpt2")
+print("Metin modeli yüklendi.")
+# Yüksek kaliteli SpeechT5 TTS modeli
+print("SpeechT5 modeli yükleniyor...")
+processor = SpeechT5Processor.from_pretrained("microsoft/speecht5_tts")
+tts_model = SpeechT5ForTextToSpeech.from_pretrained("microsoft/speecht5_tts")
+vocoder = SpeechT5HifiGan.from_pretrained("microsoft/speecht5_hifigan")
+print("SpeechT5 modeli yüklendi.")
+# Konuşmacı embedding'i al - kadın sesi
+embeddings_dataset = load_dataset("Matthijs/cmu-arctic-xvectors", split="validation")
+speaker_embeddings = torch.tensor(embeddings_dataset[7306]["xvector"]).unsqueeze(0)  # Kadın ses
 def generate_turkish_text(prompt, max_length=100):
     """Türkçe metin üretme fonksiyonu"""
         generated_text = generated_text[len(prompt):].strip()
     return generated_text
+def create_speech(text):
+    """Yüksek kaliteli konuşma üretme fonksiyonu"""
+    # Metni işle
+    inputs = processor(text=text, return_tensors="pt")
+    # Ses üret
+    speech = tts_model.generate_speech(
+        inputs["input_ids"],
+        speaker_embeddings,
+        vocoder=vocoder
+    )
+    # Numpy dizisine dönüştür
+    speech_np = speech.numpy()
+    return speech_np
 def process_input(text):
     try:
         if not text or text.strip() == "":
         print(f"Üretilen yanıt: {response[:50]}...")
+        # Yüksek kaliteli ses üret
+        print("Yüksek kaliteli ses dosyası oluşturuluyor...")
         audio_path = "response.wav"
+        # Türkçe metni İngilizce telaffuz edebilecek hale getir
+        # SpeechT5 sadece İngilizce için eğitilmiş, bu yüzden bir miktar uyarlama gerekiyor
+        response_for_speech = response
+        # Sesi oluştur ve kaydet
+        speech_array = create_speech(response_for_speech)
+        sf.write(audio_path, speech_array, 16000)
         print(f"İşlem tamamlandı ({time.time() - start_time:.2f} saniye)")

requirements.txt CHANGED Viewed

@@ -1,9 +1,9 @@
 gradio==3.32.0
 transformers==4.30.2
 torch==2.0.1
-TTS==0.17.4
-numpy==1.22.0
-scipy==1.11.2
 protobuf==3.20.3
 tqdm
 sentencepiece

 gradio==3.32.0
 transformers==4.30.2
 torch==2.0.1
+soundfile==0.12.1
+datasets==2.13.0
+numpy>=1.17.0
 protobuf==3.20.3
 tqdm
 sentencepiece