rbawden
/

modern_french_normalisation

Text2Text Generation

Model card Files Files and versions Community

rbawden commited on May 30, 2022

Commit

a61edaf

•

1 Parent(s): 7dab9c4

Update pipeline.py

Files changed (1) hide show

pipeline.py +3 -3

pipeline.py CHANGED Viewed

@@ -6,7 +6,7 @@ import html.parser
 import unicodedata
 import sys, os, re
-class ReaccentPipeline(Pipeline):
     def __init__(self, beam_size=5, batch_size=32, **kwargs):
         self.beam_size = beam_size
@@ -153,7 +153,7 @@ class ReaccentPipeline(Pipeline):
 def normalise_text(list_sents, batch_size=32, beam_size=5):
     tokeniser = AutoTokenizer.from_pretrained("rbawden/modern_french_normalisation", use_auth_token=True)
     model = AutoModelForSeq2SeqLM.from_pretrained("rbawden/modern_french_normalisation", use_auth_token=True)
-    normalisation_pipeline = ReaccentPipeline(model=model,
                                               tokenizer=tokeniser,
                                               batch_size=batch_size,
                                               beam_size=beam_size)
@@ -163,7 +163,7 @@ def normalise_text(list_sents, batch_size=32, beam_size=5):
 def normalise_from_stdin(batch_size=32, beam_size=5):
     tokeniser = AutoTokenizer.from_pretrained("rbawden/modern_french_normalisation", use_auth_token=True)
     model = AutoModelForSeq2SeqLM.from_pretrained("rbawden/modern_french_normalisation", use_auth_token=True)
-    normalisation_pipeline = ReaccentPipeline(model=model,
                                               tokenizer=tokeniser,
                                               batch_size=batch_size,
                                               beam_size=beam_size)

 import unicodedata
 import sys, os, re
+class NormalisationPipeline(Pipeline):
     def __init__(self, beam_size=5, batch_size=32, **kwargs):
         self.beam_size = beam_size
 def normalise_text(list_sents, batch_size=32, beam_size=5):
     tokeniser = AutoTokenizer.from_pretrained("rbawden/modern_french_normalisation", use_auth_token=True)
     model = AutoModelForSeq2SeqLM.from_pretrained("rbawden/modern_french_normalisation", use_auth_token=True)
+    normalisation_pipeline = NormalisationPipeline(model=model,
                                               tokenizer=tokeniser,
                                               batch_size=batch_size,
                                               beam_size=beam_size)
 def normalise_from_stdin(batch_size=32, beam_size=5):
     tokeniser = AutoTokenizer.from_pretrained("rbawden/modern_french_normalisation", use_auth_token=True)
     model = AutoModelForSeq2SeqLM.from_pretrained("rbawden/modern_french_normalisation", use_auth_token=True)
+    normalisation_pipeline = NormalisationPipeline(model=model,
                                               tokenizer=tokeniser,
                                               batch_size=batch_size,
                                               beam_size=beam_size)