Spaces:

siddhartharya
/

My_NotebookLM_Podcast_Generator

Running

siddhartharya commited on Sep 29, 2024

Commit

ba22d1b

verified ·

1 Parent(s): 8412e92

Update utils.py

Files changed (1) hide show

utils.py CHANGED Viewed

@@ -2,8 +2,12 @@ from groq import Groq
 from pydantic import BaseModel, ValidationError
 from typing import List, Literal
 import os
 groq_client = Groq(api_key=os.environ["GROQ_API_KEY"])
 class DialogueItem(BaseModel):
     speaker: Literal["Host", "Guest"]
@@ -12,6 +16,12 @@ class DialogueItem(BaseModel):
 class Dialogue(BaseModel):
     dialogue: List[DialogueItem]
 def generate_script(system_prompt: str, input_text: str, tone: str):
     input_text = truncate_text(input_text)
     prompt = f"{system_prompt}\nTONE: {tone}\nINPUT TEXT: {input_text}"
@@ -20,7 +30,7 @@ def generate_script(system_prompt: str, input_text: str, tone: str):
         messages=[
             {"role": "system", "content": prompt},
         ],
-        model="llama-3.1-70b-versatile",  # Updated to the correct model name
         max_tokens=2048,
         temperature=0.7
     )
@@ -32,4 +42,8 @@ def generate_script(system_prompt: str, input_text: str, tone: str):
     return dialogue
-# Make sure the truncate_text function is defined here or imported if it's in another file

 from pydantic import BaseModel, ValidationError
 from typing import List, Literal
 import os
+import tiktoken
+from gtts import gTTS
+import tempfile
 groq_client = Groq(api_key=os.environ["GROQ_API_KEY"])
+tokenizer = tiktoken.get_encoding("cl100k_base")
 class DialogueItem(BaseModel):
     speaker: Literal["Host", "Guest"]
 class Dialogue(BaseModel):
     dialogue: List[DialogueItem]
+def truncate_text(text, max_tokens=2048):
+    tokens = tokenizer.encode(text)
+    if len(tokens) > max_tokens:
+        return tokenizer.decode(tokens[:max_tokens])
+    return text
 def generate_script(system_prompt: str, input_text: str, tone: str):
     input_text = truncate_text(input_text)
     prompt = f"{system_prompt}\nTONE: {tone}\nINPUT TEXT: {input_text}"
         messages=[
             {"role": "system", "content": prompt},
         ],
+        model="llama-3.1-70b-versatile",
         max_tokens=2048,
         temperature=0.7
     )
     return dialogue
+def generate_audio(text: str, speaker: str) -> str:
+    tts = gTTS(text, lang='en', tld='com' if speaker == "Host" else 'co.uk')
+    with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as temp_audio:
+        tts.save(temp_audio.name)
+        return temp_audio.name