Spaces:

tournas
/

storytelling_assistant

Running

App Files Files Community

tournas commited on Feb 15

Commit

e9ab1be

verified ·

1 Parent(s): 9ac3620

Upload app.py

Browse files

Files changed (1) hide show

app.py +76 -0

app.py ADDED Viewed

	@@ -0,0 +1,76 @@

+import os
+import gradio as gr
+import torch
+import nltk
+import random
+from openai import OpenAI
+from transformers import pipeline, AutoModelForCausalLM, AutoTokenizer
+from diffusers import StableDiffusionPipeline
+from ultralytics import YOLO
+from gtts import gTTS
+from PIL import Image
+import numpy as np
+# Βεβαιωθείτε ότι το API Key υπάρχει
+api_key = os.getenv("OPENAI_API_KEY")
+if not api_key:
+    raise ValueError("⚠️ OpenAI API Key is missing! Add it as a Secret in Hugging Face Spaces.")
+# OpenAI Client
+client = OpenAI(api_key=api_key)
+# Φόρτωση μοντέλων
+print("Loading models...")
+yolo_model = YOLO("yolov8s.pt")  # Μοντέλο Object Detection
+text_generation = pipeline("text-generation", model="gpt2")
+stable_diffusion = StableDiffusionPipeline.from_pretrained("runwayml/stable-diffusion-v1-5")
+nltk.download("punkt")
+def generate_story(prompt):
+    response = client.completions.create(
+        model="gpt-4o",
+        prompt=prompt,
+        max_tokens=300
+    )
+    return response.choices[0].text.strip()
+def detect_objects(image):
+    results = yolo_model(image)
+    return results[0].plot()
+def generate_image(prompt):
+    image = stable_diffusion(prompt).images[0]
+    return image
+def text_to_speech(text):
+    tts = gTTS(text=text, lang="en")
+    tts.save("output.mp3")
+    return "output.mp3"
+demo = gr.Interface(
+    fn={
+        "Generate Story": generate_story,
+        "Detect Objects": detect_objects,
+        "Generate Image": generate_image,
+        "Text to Speech": text_to_speech,
+    },
+    inputs={
+        "Generate Story": gr.Textbox(placeholder="Write a story prompt..."),
+        "Detect Objects": gr.Image(type="numpy"),
+        "Generate Image": gr.Textbox(placeholder="Describe an image..."),
+        "Text to Speech": gr.Textbox(placeholder="Enter text to convert to speech...")
+    },
+    outputs={
+        "Generate Story": "text",
+        "Detect Objects": "image",
+        "Generate Image": "image",
+        "Text to Speech": "audio"
+    },
+    title="AI-Powered Storytelling Assistant",
+    description="An AI assistant combining NLP, Object Detection, Image Generation, and TTS!"
+)
+if __name__ == "__main__":
+    demo.launch()