Spaces:

AreesaAshfaq
/

langTranslator

Running

AreesaAshfaq commited on Aug 21, 2024

Commit

a70ae15

verified ·

1 Parent(s): dd6ec5a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,7 +6,7 @@ model_name = "Helsinki-NLP/opus-mt-en-ROMANCE"
 model = MarianMTModel.from_pretrained(model_name)
 tokenizer = MarianTokenizer.from_pretrained(model_name)
-# Define language codes supported by the model
 language_codes = {
     'French': 'fr',
     'German': 'de',
@@ -19,8 +19,9 @@ language_codes = {
 def translate_text(text, target_lang_code):
     # Prepare the input and translate
     inputs = tokenizer.encode(text, return_tensors="pt")
-    # Generate the translation
-    translated = model.generate(inputs, decoder_start_token_id=tokenizer.get_lang_id(target_lang_code))
     translated_text = tokenizer.decode(translated[0], skip_special_tokens=True)
     return translated_text

 model = MarianMTModel.from_pretrained(model_name)
 tokenizer = MarianTokenizer.from_pretrained(model_name)
+# Define target language codes directly
 language_codes = {
     'French': 'fr',
     'German': 'de',
 def translate_text(text, target_lang_code):
     # Prepare the input and translate
     inputs = tokenizer.encode(text, return_tensors="pt")
+    # Set the decoder start token ID based on language code
+    decoder_start_token_id = tokenizer.convert_tokens_to_ids(f"<{target_lang_code}>")
+    translated = model.generate(inputs, decoder_start_token_id=decoder_start_token_id)
     translated_text = tokenizer.decode(translated[0], skip_special_tokens=True)
     return translated_text