Text2Text Generation
Transformers
PyTorch
Oriya
Hindi
English
mt5
india language
Inference Endpoints
odia-t5-base / README.md
mrSoul7766's picture
Update README.md
588c30a verified
metadata
datasets:
  - OdiaGenAI/odia_domain_context_train_v1
  - OdiaGenAI/odia_context_qa_98k
  - OdiaGenAI/OdiEnCorp_translation_instructions_25k
language:
  - or
  - hi
  - en
metrics:
  - bleu
  - rouge
tags:
  - india language
widget:
  - text: >-
      translate into odia: And thy seed shall be as the dust of the earth, and
      thou shalt spread abroad to the west, and to the east, and to the north,
      and to the south: and in thee and in thy seed shall all the families of
      the earth be blessed.</s>
    example_title: English to odia translation
  - text: >-
      translate into odia: पाकिस्तानी जासूस को मिली अहम खुफिया जानकारी, जम्मू
      कश्मीर के पुलिस अधिकारी से हुई लापरवाही</s>
    example_title: Hindi to odia translation
  - text: 'answer: ଓଡ଼ିଶାରେ ଅଟ୍ଟାଳିକା ପାଇଁ ସର୍ବାଧିକ ଆସନ ସୀମା କ’ଣ?</s>'
    example_title: Question answer
  - text: >-
      summarize: ନନ୍ଦିଗ୍ରାମରେ ଶୁଭେନ୍ଦୁ ଅଧିକାରୀଙ୍କ ସହ ହେବାକୁ ଯାଉଥିବା ନିର୍ବାଚନୀ
      ଯୁଦ୍ଧ ଅବସରରେ ଭାଜପାର ବିରୋଧୀ ଦଳର ନେତାଙ୍କୁ ଚିଠି ଲେଖିଛନ୍ତି ପଶ୍ଚିମବଙ୍ଗ
      ମୁଖ୍ୟମନ୍ତ୍ରୀ ମମତା ବାର୍ନାଜୀ। ଏହି ଚିଠି କଂଗ୍ରେସର ସୋନିଆ ଗାନ୍ଧୀଙ୍କ ସମେତ ପ୍ରମୁଖ
      ୧୦ ବିରୋଧୀ ଦଳର ନେତାଙ୍କୁ ବୁଧବାର ପଠା ଯାଇଛି। ଚଳିତ ବିଧାନସଭା ନିର୍ବାଚନ ପରେ
      ଭାଜପାକୁ ହଟାଇବା ପାଇଁ ଏକତ୍ରିତ ହୋଇ କେଉଁ ରଣନୀତି ଆପଣେଇବାକୁ ପଡ଼ିବ ସେ ସମ୍ପର୍କରେ
      ଉଲ୍ଲେଖ କରିଛନ୍ତି ତୃଣମୂଳ କଂଗ୍ରେସ (ଟିଏମ୍‌ସି) ସୁପ୍ରିମୋ। ଗଣତନ୍ତ୍ର ଉପରେ ଭାଜପାର
      ଆକ୍ରମଣ ବିରୋଧରେ ଏକତ୍ରିତ ହେବାର ସମୟ ଆସିଯାଇଛି। ଦେଶର ନାଗରିକଙ୍କ ପାଇଁ ଏକ
      ବିଶ୍ୱସନୀୟ ବିକଳ୍ପ ଉପସ୍ଥାପନ କରିବାକୁ ଚିଠିରେ ମମତା ଉଲ୍ଲେଖ କରିଛନ୍ତି। ଦିଲ୍ଲୀ
      ଗଭର୍ନରଙ୍କୁ ନିର୍ବାଚିତ ସରକାରଙ୍କଠାରୁ ଅଧିକ ଶକ୍ତି ପ୍ରଦାନ କରୁଥିବା ନୂଆ ବିବାଦୀୟ
      ଆଇନ ଭଳି ୭ଟି ବିବାଦୀୟ ଘଟଣା ତଥା ଆଇନ ସମ୍ପର୍କରେ ଚିଠିରେ ଉଲ୍ଲେଖ କରିଛନ୍ତି ମମତା।
      ସୋନିଆଙ୍କ ବ୍ୟତୀତ ନ୍ୟାଶନାଲିଷ୍ଟ କଂଗ୍ରେସ ପାର୍ଟି ମୁଖ୍ୟ ଶରଦ ପାଓ୍ବାର, ଡିଏମ୍‌କେର
      ଷ୍ଟାଲିନ, ଶିବ ସେନାର ଉଦ୍ଧବ ଠାକରେ, ଓ୍ବାଇଆରଏସ୍‌ର ଜଗନ ମୋହନ ରେଡ୍ଡୀ, ବିଜେଡି
      ସୁପ୍ରିମୋ ନବୀନ ପଟ୍ଟନାୟକ, ଟିଆରଏସ୍‌ର କେ. ଚନ୍ଦ୍ରଶେଖର ରାଓ, ସମାଜବାଦୀ ପାର୍ଟିର
      ଅଖିଳେଶ ଯାଦବ, ରାଷ୍ଟ୍ରୀୟ ଜନତା ଦଳର ତେଜସ୍ବୀ ଯାଦବ, ଆମ ଆଦମି ପାର୍ଟିର ଅରବିନ୍ଦ
      କେଜରିଓ୍ବାଲ ଓ ସିପିଆଇଏମ୍‌ଏଲର ଦୀପାଙ୍କର ଭଟ୍ଟଚାର୍ଯ୍ୟଙ୍କୁ ଏହି ଚିଠି ପଠାଯାଇଛି</s>
    example_title: summarize
  - text: >-
      context: ଯେଉଁମାନେ ଏଭଳି ଉପଲବ୍ଧତାର ପୂର୍ବାନୁମାନ କରିପାରିବେ ନାହିଁ ସେମାନଙ୍କ
      ତୁଳନାରେ ସେମାନେ ପରିବେଶଗତ ସମ୍ବଳକୁ (ଯେପରିକି ଆଲୋକ ଏବଂ ଖାଦ୍ୟ) ସର୍ବୋତ୍ତମ ଭାବେ
      ଉପଯୋଗ କରିପାରିବେ। question: କେଉଁ ଜୀବ ସର୍କାଡିଆନ ରିଦମ ବ୍ୟବହାର କରି ଏହାର ଲାଭ
      ଉଠାଇପାରିବ ଯାହା ଅନ୍ୟମାନେ କରିପାରିବେ ନାହିଁ? </s>
    example_title: Context-Based qa
license: cc-by-sa-4.0

Model Card for odia-t5-base

model image

Model Details

Model Description

odia-t5-base is a multilingual Text-To-Text Transfer Transformer fine-tuned to perform downstream tasks in the Odia language.

  • Developed by: Mohammed Ashraf
  • Model type: Language model
  • Language(s) (NLP): Odia, English, Hindi
  • License: CC BY-NC-SA 4.0
  • Related Models: All MT5 Checkpoints

Uses

Direct Use and Downstream Use

  • Translate English to Odia.
  • Translate Hind to Odia.
  • Odia Sentence Summarization.
  • Question Answering in Odia.
  • Context-Based Question answering in Odia.

How to use

from transformers import AutoTokenizer, AutoModelForSeq2SeqLM

tokenizer = AutoTokenizer.from_pretrained("mrSoul7766/odia-t5-base")
model = AutoModelForSeq2SeqLM.from_pretrained("mrSoul7766/odia-t5-base")

# Set maximum generation length
max_length = 512

# Generate response with question as input
input_ids = tokenizer.encode("answer: ଓଡ଼ିଶାରେ ଅଟ୍ଟାଳିକା ପାଇଁ ସର୍ବାଧିକ ଆସନ ସୀମା କ’ଣ?</s>", return_tensors="pt")
output_ids = model.generate(input_ids, max_length=max_length)

# Decode response
response = tokenizer.decode(output_ids[0], skip_special_tokens=True)
print(response)

Licensing Information

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

CC BY-NC-SA 4.0

Citation Information

Dataset

@misc{OdiaGenAI,
  author = {Shantipriya Parida and Sambit Sekhar and Subhadarshi Panda and Soumendra Kumar Sahoo and Swateek Jena and Abhijeet Parida and Arghyadeep Sen and Satya Ranjan Dash and Deepak Kumar Pradhan},
  title = {OdiaGenAI: Generative AI and LLM Initiative for the Odia Language},
  year = {2023},
  publisher = {Hugging Face},
  journal = {Hugging Face repository},
  howpublished = {\url{https://huggingface.co/OdiaGenAI}},
}

Model

@misc{mrSoul7766,
  author = {Mohammed Ashraf},
  title = {odia-t5-base},
  year = {2024},
  note = {Licensed under Attribution-NonCommercial-ShareAlike 4.0 International},
}