Spaces:

veni18
/

STT-translation-summarization

Sleeping

fix

f74bb47 8 months ago

1.73 kB

	import gradio as gr
	from transformers import pipeline
	import requests
	import json
	import os

	def speechToText(file):

	api_key = os.getenv("veni18sttts")
	API_URL = "https://api-inference.huggingface.co/models/openai/whisper-large-v3-turbo"
	headers = {"Authorization": f"Bearer {api_key}"}

	def query(file):
	with open(file, "rb") as f:
	data = f.read()
	response = requests.post(API_URL, headers=headers, data=data)
	return response.json()

	my_text = query(file)

	#sentences = my_text["text"].split(".")


	def translate(sentences):
	translation = pipeline("translation", model="Helsinki-NLP/opus-mt-en-hu")

	text_translated=[]
	for text in sentences:
	text_translated.append(translation(text))

	return text_translated

	#text_translate = translate(sentences)

	#combined_text = ' '.join([item['translation_text'] for sublist in text_translated for item in sublist])

	def summa(my_text):
	pipe = pipeline("summarization", model="facebook/bart-large-cnn")

	max = 1024
	if len(my_text) > max:
	combined_text_parts = [my_text[i:i + max] for i in range(0, len(my_text), max)]
	else:
	combined_text_parts = [my_text]

	summaries = []
	for part in combined_text_parts:
	summary = pipe(part, max_length=180, min_length=140, do_sample=False)
	summaries.append(summary[0]['summary_text'])


	full_summary = ' '.join(summaries)


	return full_summary

	full_summaries = summa(my_text["text"])

	return full_summaries

	demo = gr.Interface(fn=speechToText, inputs="file", outputs="text")
	demo.launch()