Spaces:

ChiBenevisamPas
/

Video-Subtitle-Translate

Runtime error

App Files Files Community

ChiBenevisamPas commited on Oct 13, 2024

Commit

9a2739a

verified ·

1 Parent(s): bccbcad

Update app.py

Browse files

Files changed (1) hide show

app.py +6 -25

app.py CHANGED Viewed

@@ -48,20 +48,13 @@ def write_srt(transcription, output_file, tokenizer=None, translation_model=None
 def save_as_word(transcription, file_name, tokenizer=None, translation_model=None):
     doc = Document()
     doc.add_heading('Video Subtitles', 0)
-    for i, segment in enumerate(transcription['segments']):
-        start = segment['start']
-        end = segment['end']
         text = segment['text']
         if translation_model:
             text = translate_text(text, tokenizer, translation_model)
-        start_time = whisper.utils.format_timestamp(start)
-        end_time = whisper.utils.format_timestamp(end)
-        doc.add_paragraph(f"{i + 1}")
-        doc.add_paragraph(f"{start_time} --> {end_time}")
-        doc.add_paragraph(f"{text.strip()}\n")
     word_file = f"{file_name}.docx"
     doc.save(word_file)
@@ -74,19 +67,12 @@ def save_as_pdf(transcription, file_name, tokenizer=None, translation_model=None
     pdf.set_font("Arial", size=12)
     pdf.cell(200, 10, txt="Video Subtitles", ln=True, align="C")
-    for i, segment in enumerate(transcription['segments']):
-        start = segment['start']
-        end = segment['end']
         text = segment['text']
         if translation_model:
             text = translate_text(text, tokenizer, translation_model)
-        start_time = whisper.utils.format_timestamp(start)
-        end_time = whisper.utils.format_timestamp(end)
-        pdf.cell(200, 10, txt=f"{i + 1}", ln=True)
-        pdf.cell(200, 10, txt=f"{start_time} --> {end_time}", ln=True)
         pdf.multi_cell(200, 10, txt=f"{text.strip()}\n")
     pdf_file = f"{file_name}.pdf"
@@ -97,23 +83,18 @@ def save_as_powerpoint(transcription, file_name, tokenizer=None, translation_mod
     prs = Presentation()
     slide_layout = prs.slide_layouts[1]  # Title and Content layout
-    for i, segment in enumerate(transcription['segments']):
-        start = segment['start']
-        end = segment['end']
         text = segment['text']
         if translation_model:
             text = translate_text(text, tokenizer, translation_model)
-        start_time = whisper.utils.format_timestamp(start)
-        end_time = whisper.utils.format_timestamp(end)
         slide = prs.slides.add_slide(slide_layout)
         title = slide.shapes.title
         body = slide.shapes.placeholders[1]
-        title.text = f"Subtitle {i + 1}"
-        body.text = f"{start_time} --> {end_time}\n\n{text.strip()}"
     ppt_file = f"{file_name}.pptx"
     prs.save(ppt_file)

 def save_as_word(transcription, file_name, tokenizer=None, translation_model=None):
     doc = Document()
     doc.add_heading('Video Subtitles', 0)
+    for segment in transcription['segments']:
         text = segment['text']
         if translation_model:
             text = translate_text(text, tokenizer, translation_model)
+        doc.add_paragraph(text.strip())
     word_file = f"{file_name}.docx"
     doc.save(word_file)
     pdf.set_font("Arial", size=12)
     pdf.cell(200, 10, txt="Video Subtitles", ln=True, align="C")
+    for segment in transcription['segments']:
         text = segment['text']
         if translation_model:
             text = translate_text(text, tokenizer, translation_model)
         pdf.multi_cell(200, 10, txt=f"{text.strip()}\n")
     pdf_file = f"{file_name}.pdf"
     prs = Presentation()
     slide_layout = prs.slide_layouts[1]  # Title and Content layout
+    for segment in transcription['segments']:
         text = segment['text']
         if translation_model:
             text = translate_text(text, tokenizer, translation_model)
         slide = prs.slides.add_slide(slide_layout)
         title = slide.shapes.title
         body = slide.shapes.placeholders[1]
+        title.text = "Subtitle"
+        body.text = text.strip()
     ppt_file = f"{file_name}.pptx"
     prs.save(ppt_file)