Spaces:

Aesopskenya
/

KenyanLanguageTranslator

Sleeping

App Files Files Community

sophicist commited on Jan 10

Commit

2d553a1

1 Parent(s): 42b3cd3

added new changes

Browse files

Files changed (1) hide show

app.py +75 -21

app.py CHANGED Viewed

@@ -1,22 +1,76 @@
 import gradio as gr
-from transformers import MBart50TokenizerFast, MBartForConditionalGeneration
-from dotenv import load_dotenv
-import os
-from huggingface_hub import login
-# load_dotenv()  # Load environment variables from .env file
-# huggingface_token = os.getenv("HUGGINGFACE_TOKEN")
-# # Log in using the token
-# login(token=huggingface_token)
-# Load the model and tokenizer from Hugging Face Hub
-model_name = "Aesopskenya/translator"
-tokenizer = MBart50TokenizerFast.from_pretrained(model_name)
-model = MBartForConditionalGeneration.from_pretrained(model_name)
-def translate_gikuyu(sentence):
     # Tokenize input
-    inputs = tokenizer(sentence, return_tensors="pt", truncation=True, padding=True, max_length=128)
     # Generate translation
     outputs = model.generate(inputs.input_ids, max_length=128)
@@ -27,13 +81,13 @@ def translate_gikuyu(sentence):
 # Define Gradio interface
 iface = gr.Interface(
-    fn=translate_gikuyu,
     inputs="text",
     outputs="text",
-    title="Gikuyu-English Translator",
-    description="Enter a Gikuyu sentence, and the model will translate it into English."
 )
-# Launch the interface
 if __name__ == "__main__":
     iface.launch(server_name="0.0.0.0", server_port=7860)

 import gradio as gr
+from transformers import (
+    MBart50TokenizerFast,
+    MBartForConditionalGeneration,
+    AutoTokenizer,
+    AutoModelForSequenceClassification,
+)
+import torch
+# Load the language detection model
+lang_detector_name = "Aesopskenya/LanguageDetector"
+lang_tokenizer = AutoTokenizer.from_pretrained(lang_detector_name)
+lang_model = AutoModelForSequenceClassification.from_pretrained(lang_detector_name)
+# Define the language mapping to models
+lang_to_model = {
+    "Gikuyu": "Aesopskenya/translator",
+    "Kalenjin": "Aesopskenya/KalenjinTranslator",
+    "Kamba": "Aesopskenya/KambaTranslation",
+    "Luo": "Aesopskenya/LuoTranslator",
+    "Sheng": "Aesopskenya/ShengTranslation",
+}
+# Reverse mapper for language detection
+reverse_mapper = {
+    0: "English",
+    1: "Sheng",
+    2: "Other",
+    3: "Luhya",
+    4: "Kamba",
+    5: "Gikuyu",
+    6: "Kalenjin",
+    7: "Luo",
+}
+# Function to detect language
+def detect_language(text):
+    inputs = lang_tokenizer(
+        text,
+        max_length=128,
+        padding=True,
+        truncation=True,
+        return_tensors="pt",
+    )
+    with torch.no_grad():
+        outputs = lang_model(**inputs)
+        logits = outputs.logits
+        prediction = torch.argmax(logits, dim=-1).item()
+    return reverse_mapper[prediction]
+# Function to load the appropriate model and tokenizer
+def load_model_and_tokenizer(language):
+    model_name = lang_to_model.get(language)
+    if model_name:
+        tokenizer = MBart50TokenizerFast.from_pretrained(model_name)
+        model = MBartForConditionalGeneration.from_pretrained(model_name)
+        return tokenizer, model
+    return None, None
+# Function to translate text
+def translate_text(text):
+    # Detect the language
+    detected_language = detect_language(text)
+    if detected_language not in lang_to_model:
+        return f"Language '{detected_language}' is not supported for translation."
+    # Load the appropriate model and tokenizer
+    tokenizer, model = load_model_and_tokenizer(detected_language)
+    if not tokenizer or not model:
+        return "Error loading the translation model."
     # Tokenize input
+    inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True, max_length=128)
     # Generate translation
     outputs = model.generate(inputs.input_ids, max_length=128)
 # Define Gradio interface
 iface = gr.Interface(
+    fn=translate_text,
     inputs="text",
     outputs="text",
+    title="Multi-Language Translator",
+    description="Enter a sentence, and the model will detect its language and translate it into English.",
 )
+# Launch the app
 if __name__ == "__main__":
     iface.launch(server_name="0.0.0.0", server_port=7860)