Spaces:

englissi
/

bgtts

Sleeping

File size: 1,896 Bytes

6a81069
2252ea3
5ecf50f
dac6347
2252ea3
5ecf50f
dac6347
2252ea3
 
 
 
 
 
5ecf50f
2252ea3
 
 
 
 
 
 
5ecf50f
 
2252ea3
 
 
 
 
 
 
5ecf50f
2252ea3
 
 
 
 
 
dac6347
 
 
 
 
2252ea3
5ecf50f
2252ea3
8d444a7
6a81069
2252ea3

import gradio as gr
from transformers import AutoTokenizer, AutoModelForCausalLM
from TTS.api import TTS  # Coqui TTS 라이브러리

# 모델 이름
model_name = "mradermacher/SambaLingo-Bulgarian-Base-i1-GGUF"

# 모델 및 토크나이저 로드
try:
    tokenizer = AutoTokenizer.from_pretrained(model_name)
    model = AutoModelForCausalLM.from_pretrained(model_name)
except Exception as e:
    raise RuntimeError(f"모델 로드 중 문제가 발생했습니다: {e}")

# TTS 모델 로드 (Coqui TTS)
try:
    tts = TTS(model_name="tts_models/bg/cv/vits", progress_bar=False)
except Exception as e:
    raise RuntimeError(f"TTS 모델 로드 중 문제가 발생했습니다: {e}")

# 텍스트 생성 및 음성 변환 함수
def generate_audio(input_text):
    # 텍스트 생성
    try:
        inputs = tokenizer.encode(input_text, return_tensors="pt")
        outputs = model.generate(inputs, max_length=100, num_return_sequences=1)
        generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
    except Exception as e:
        return f"텍스트 생성 중 문제가 발생했습니다: {e}", None

    # TTS 변환
    try:
        audio_path = "output.wav"
        tts.tts_to_file(text=generated_text, file_path=audio_path)
        return generated_text, audio_path
    except Exception as e:
        return f"TTS 변환 중 문제가 발생했습니다: {e}", None

# Gradio 인터페이스 생성
interface = gr.Interface(
    fn=generate_audio,
    inputs=gr.Textbox(lines=5, label="불가리아어 텍스트 입력"),
    outputs=[gr.Textbox(label="생성된 텍스트"), gr.Audio(label="생성된 음성")],
    title="불가리아어 텍스트 생성 및 음성 변환",
    description="불가리아어 텍스트를 입력하면 텍스트를 생성하고 음성으로 변환합니다."
)

# 앱 실행
if __name__ == "__main__":
    interface.launch()