Spaces:

ak5005
/

derrobot

Sleeping

ak5005 commited on May 6

Commit

c1e64ce

1 Parent(s): edb1927

Remove spacy download step; use pip-installed model

Files changed (2) hide show

categories/accuracy.py CHANGED Viewed

@@ -10,7 +10,7 @@ from transformers import AutoModel, AutoTokenizer
 # setup global variables on import (bad practice, but whatever)
 # --------------------------------------------------------------
-aligner = SentenceAligner(model="bert-base-multilingual-cased", layer=6)
 de_encoder = LaserEncoderPipeline(lang="deu_Latn")
 en_encoder = LaserEncoderPipeline(lang="eng_Latn")

 # setup global variables on import (bad practice, but whatever)
 # --------------------------------------------------------------
+aligner = SentenceAligner(model="xlm-roberta-base", layer=6)
 de_encoder = LaserEncoderPipeline(lang="deu_Latn")
 en_encoder = LaserEncoderPipeline(lang="eng_Latn")

categories/fluency.py CHANGED Viewed

@@ -12,7 +12,7 @@ from transformers import AutoModelForMaskedLM, AutoTokenizer
 tool = language_tool_python.LanguageTool("en-US")
 # masked language model and tokenizer from huggingface
-model_name = "distilbert-base-multilingual-cased"
 model = AutoModelForMaskedLM.from_pretrained(model_name)
 model.eval()
 tokenizer = AutoTokenizer.from_pretrained(model_name)  # tokenizer

 tool = language_tool_python.LanguageTool("en-US")
 # masked language model and tokenizer from huggingface
+model_name = "xlm-roberta-base"
 model = AutoModelForMaskedLM.from_pretrained(model_name)
 model.eval()
 tokenizer = AutoTokenizer.from_pretrained(model_name)  # tokenizer