Spaces:

Chemsseddine
/

summarisation

Sleeping

App Files Files Community

summarisation / app.py

Chemsseddine

Update app.py

531e999 over 2 years ago

raw

history blame contribute delete

3.23 kB

	from transformers import RobertaTokenizerFast, EncoderDecoderModel
	import torch
	#initialisation de tokenizer
	device = "cuda" if torch.cuda.is_available() else "cpu"
	tokenizer = RobertaTokenizerFast.from_pretrained("Chemsseddine/bert2gpt2SUMM-finetuned-mlsum")
	#Chemsseddine/bert2gpt2SUMM-finetuned-mlsum
	#aider les token special
	tokenizer.bos_token = tokenizer.cls_token
	tokenizer.eos_token = tokenizer.sep_token
	#initialisation du modele
	model = EncoderDecoderModel.from_pretrained("Chemsseddine/bert2gpt2SUMM-finetuned-mlsum").to(device)
	#tf.random.set_seed(0)
	# generate summary
	def generateSumm(input_texte,max,min):
	# encoder le texte entrée
	if input_texte and input_texte.strip():
	if min<len(input_texte):

	if max>min:

	input_ids = tokenizer.encode(input_texte, return_tensors='pt')
	#generation de resume a l'aide de texte encodé
	summary_ids = model.generate(input_ids,#le texte encodé
	max_length=max,#la longuer maximale du sequence de sortie
	min_length=min,#la longuer minimum du sequence de sortie

	num_beams=5,
	repetition_penalty=2.5,
	length_penalty=1.0,
	early_stopping=True,#pour que la génération soit terminée lorsque toutes les hypothèses de faisceau ont atteint le jeton EOS.
	no_repeat_ngram_size=2,#aucun 2 grammes n'apparaisse deux fois#Pour éviter les répétitions du même texte,
	use_cache=True,
	do_sample = True,
	# num_return_sequences=5,
	temperature = 0.8,
	top_k = 50,
	top_p = 0.95)
	#decodé la sequence de generé par le modele
	summary_text = tokenizer.decode(summary_ids[0], skip_special_tokens=True)
	return summary_text
	else:

	summary_text="La longueur minimale est grande que la maximale"
	return summary_text
	else:
	summary_text="La longueur de texte entré est inferieur que la minimale que vous avez choisis"
	return summary_text

	else :
	summary_text="Entrer votre Texte S'il vous plait"
	return summary_text


	from difflib import Differ
	import gradio as gr
	demo = gr.Blocks()

	def diff_texts(text1, text2):
	d = Differ()
	return [
	(token[2:], token[0] if token[0] != " " else None)
	for token in d.compare(text1.split(), text2.split())]


	inp=gr.inputs.Textbox(label="Text Originale",placeholder="Entrer Texte ici...")
	out=gr.outputs.Textbox(label="Résumé")
	mx_length=gr.Slider(40, 512)
	mn_length=gr.Slider(10,120)

	with demo:
	gr.Markdown("*<center>Résumé Votre Text à l'aide de IA.</center>*\n\n Vous pouvez résumé votre texte par entrer le texte originale, et vous pouvez comparer le resultat avec votre texte originale en cliquant sur Comparer resultat ")

	with gr.Tabs():

	with gr.TabItem("Résumé"):
	gr.Interface(fn=generateSumm, inputs=[inp,mx_length,mn_length], outputs=out ,cache_examples=True,allow_flagging=False
	)
	with gr.TabItem("Comparer resultat"):
	gr.Interface(diff_texts,[inp,out],gr.HighlightedText(label="Difference"),allow_flagging=False)

	demo.launch(debug=True)