Spaces:

feedlight42
/

text2picto

Sleeping

App Files Files Community

feedlight42 commited on Nov 19, 2024

Commit

aa9f8f2

1 Parent(s): c006108

better versioning, best pratices

Browse files

Files changed (1) hide show

main.py +66 -41

main.py CHANGED Viewed

@@ -1,18 +1,32 @@
 from PIL import Image
-from fastapi import FastAPI
-from pydantic import BaseModel
 from transformers import MBartForConditionalGeneration, MBartTokenizerFast
 import torch
 import requests, json, base64
 from io import BytesIO
-# Define the input schema
 class TranslationRequest(BaseModel):
-    src: str
     language: str
-# Initialize FastAPI app
-app = FastAPI()
 # Load the model and tokenizer
 model_path = "feedlight42/mbart25-text2picto"
@@ -27,10 +41,12 @@ with open('pictogram_vocab.json', 'r') as f:
     pictogram_dict = json.load(f)
 # Fetch a pictogram image from the ARASAAC API
-def fetch_pictogram(picto_id):
     url = f"https://api.arasaac.org/v1/pictograms/{picto_id}"
     response = requests.get(url)
-    return Image.open(BytesIO(response.content))
 # Generate an image from a sequence of pictogram IDs
 def create_pictogram_image(pictogram_ids):
@@ -54,44 +70,53 @@ def create_pictogram_image(pictogram_ids):
     return final_image
-@app.post("/translate")
 def translate(request: TranslationRequest):
-    """
-    Translate text to target language and generate pictogram tokens.
-    """
-    inputs = tokenizer(request.src, return_tensors="pt", padding=True, truncation=True).to(device)
-    # Generate translation
     translated_tokens = model.generate(**inputs)
     tgt_sentence = tokenizer.decode(translated_tokens[0], skip_special_tokens=True)
-    # Process the translated sentence and map words to pictograms
-    words = tgt_sentence.split()  # Split sentence into words
     pictogram_ids = [pictogram_dict.get(word.lower(), None) for word in words]
-    pictogram_ids = [picto_id for picto_id in pictogram_ids if picto_id is not None]  # Remove None values
-    # Check if there are pictogram IDs
     if pictogram_ids:
-        # Generate the pictogram image
         final_image = create_pictogram_image(pictogram_ids)
-        # Convert image to base64
-        img_byte_arr = BytesIO()
-        final_image.save(img_byte_arr, format='PNG')
-        img_byte_arr.seek(0)
-        encoded_image = base64.b64encode(img_byte_arr.read()).decode('utf-8')
-        return {
-            "src": request.src,
-            "tgt": tgt_sentence,
-            "pictograms": pictogram_ids,
-            "image_base64": encoded_image
-        }
-    else:
-        # Return a response without an image if no pictogram IDs are found
-        return {
-            "src": request.src,
-            "tgt": tgt_sentence,
-            "pictograms": pictogram_ids,
-            "image_base64": None  # No image if no pictograms were found
-        }

 from PIL import Image
+from fastapi import FastAPI, HTTPException
+from pydantic import BaseModel, Field
 from transformers import MBartForConditionalGeneration, MBartTokenizerFast
 import torch
 import requests, json, base64
 from io import BytesIO
+from typing import Optional
+# Initialize FastAPI app with versioning
+app = FastAPI(
+    title="Text-to-Pictogram API",
+    version="1.0.0",
+    description="An API for converting text to pictograms, supporting English, French, and Tamil.",
+)
+# Define schemas for requests and responses
 class TranslationRequest(BaseModel):
+    src: str = Field(..., description="Source text to be translated.")
+    language: str = Field(..., description="Language of the source text. Accepted values: 'en', 'fr', 'ta'.")
+class TranslationResponse(BaseModel):
     language: str
+    src: str
+    tgt: Optional[str] = None
+    image_base64: Optional[str] = None
 # Load the model and tokenizer
 model_path = "feedlight42/mbart25-text2picto"
     pictogram_dict = json.load(f)
 # Fetch a pictogram image from the ARASAAC API
+def fetch_pictogram(picto_id: int):
     url = f"https://api.arasaac.org/v1/pictograms/{picto_id}"
     response = requests.get(url)
+    if response.status_code == 200:
+        return Image.open(BytesIO(response.content))
+    return None
 # Generate an image from a sequence of pictogram IDs
 def create_pictogram_image(pictogram_ids):
     return final_image
+# Endpoint for health check
+@app.get("/health", summary="Health Check", response_description="Health status")
+def health_check():
+    return {"status": "healthy", "message": "API is up and running"}
+# Main translation endpoint
+@app.post("/v1/translate", summary="Translate Text to Pictograms", response_model=TranslationResponse)
 def translate(request: TranslationRequest):
+    if request.language not in ["en", "fr", "ta"]:
+        raise HTTPException(status_code=400, detail="Invalid language. Accepted values: 'en', 'fr', 'ta'.")
+    # Placeholder for unsupported languages
+    if request.language in ["en", "ta"]:
+        return TranslationResponse(
+            language=request.language,
+            src=request.src,
+            tgt=None,
+            image_base64=None,
+        )
+    # Translate using French model
+    inputs = tokenizer(request.src, return_tensors="pt", padding=True, truncation=True).to(device)
     translated_tokens = model.generate(**inputs)
     tgt_sentence = tokenizer.decode(translated_tokens[0], skip_special_tokens=True)
+    # Map translated sentence to pictograms
+    words = tgt_sentence.split()
     pictogram_ids = [pictogram_dict.get(word.lower(), None) for word in words]
+    pictogram_ids = [picto_id for picto_id in pictogram_ids if picto_id]
     if pictogram_ids:
+        # Generate pictogram image
         final_image = create_pictogram_image(pictogram_ids)
+        if final_image:
+            img_byte_arr = BytesIO()
+            final_image.save(img_byte_arr, format="PNG")
+            encoded_image = base64.b64encode(img_byte_arr.getvalue()).decode("utf-8")
+            return TranslationResponse(
+                language=request.language,
+                src=request.src,
+                tgt=tgt_sentence,
+                image_base64=encoded_image,
+            )
+    return TranslationResponse(
+        language=request.language,
+        src=request.src,
+        tgt=tgt_sentence,
+        image_base64=None,
+    )