Spaces:

wetey
/

Headline-Content-Generator

Sleeping

wetey commited on Apr 25, 2023

Commit

8983492

1 Parent(s): f045f5a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -8,19 +8,21 @@ headline = AutoModelForSeq2SeqLM.from_pretrained("wetey/content-summarizer")
 generate_long = AutoModelForSeq2SeqLM.from_pretrained("wetey/content-generator")
 def generate_headline(text):
-    inputs = tokenizer(text, return_tensors="pt").input_ids
     generation_config = GenerationConfig(temperature = 1.2,
-                                         encoder_no_repeat_ngram_size = 4)
-    outputs = headline.generate(inputs,
-                                do_sample = True,
-                                generation_config = generation_config)
     return tokenizer.decode(outputs[0], skip_special_tokens = True)
 def generate_content(text):
-    inputs = tokenizer(text, return_tensors="pt").input_ids
     generation_config = GenerationConfig(temperature = 1.2,
                                          encoder_no_repeat_ngram_size = 2,
                                          min_length = 50,
@@ -29,9 +31,7 @@ def generate_content(text):
                                          num_beams = 4,
                                          repetition_penalty = 1.5,
                                          no_repeat_ngram_size = 3)
-    outputs = generate_long.generate(inputs,
-                                     do_sample = True,
-                                     generation_config = generation_config)
     return tokenizer.decode(outputs[0], skip_special_tokens = True)

 generate_long = AutoModelForSeq2SeqLM.from_pretrained("wetey/content-generator")
 def generate_headline(text):
+    prefix = "summarize "
+    input = prefix + text
+    inputs = tokenizer(input, return_tensors = "pt", max_length = 128, truncation = True).input_ids
     generation_config = GenerationConfig(temperature = 1.2,
+                                         encoder_no_repeat_ngram_size = 7)
+    outputs = headline.generate(inputs, do_sample = True, generation_config = generation_config)
     return tokenizer.decode(outputs[0], skip_special_tokens = True)
 def generate_content(text):
+    prefix = "generate_longer_text_from_headline: "
+    input = prefix + text
+    inputs = tokenizer(input, return_tensors="pt", max_length = 128, truncation = True).input_ids
     generation_config = GenerationConfig(temperature = 1.2,
                                          encoder_no_repeat_ngram_size = 2,
                                          min_length = 50,
                                          num_beams = 4,
                                          repetition_penalty = 1.5,
                                          no_repeat_ngram_size = 3)
+    outputs = generate_long.generate(inputs, do_sample = True, generation_config = generation_config)
     return tokenizer.decode(outputs[0], skip_special_tokens = True)