|
--- |
|
datasets: |
|
- OdiaGenAI/odia_domain_context_train_v1 |
|
- OdiaGenAI/odia_context_qa_98k |
|
- OdiaGenAI/OdiEnCorp_translation_instructions_25k |
|
language: |
|
- or |
|
- hi |
|
- en |
|
metrics: |
|
- bleu |
|
- rouge |
|
tags: |
|
- india language |
|
widget: |
|
- text: >- |
|
translate into odia: And thy seed shall be as the dust of the earth, and |
|
thou shalt spread abroad to the west, and to the east, and to the north, and |
|
to the south: and in thee and in thy seed shall all the families of the |
|
earth be blessed.</s> |
|
example_title: English to odia translation |
|
- text: >- |
|
translate into odia: पाकिस्तानी जासूस को मिली अहम खुफिया जानकारी, जम्मू |
|
कश्मीर के पुलिस अधिकारी से हुई लापरवाही</s> |
|
example_title: Hindi to odia translation |
|
- text: 'answer: ଓଡ଼ିଶାରେ ଅଟ୍ଟାଳିକା ପାଇଁ ସର୍ବାଧିକ ଆସନ ସୀମା କ’ଣ?</s>' |
|
example_title: Question answer |
|
- text: >- |
|
summarize: ନନ୍ଦିଗ୍ରାମରେ ଶୁଭେନ୍ଦୁ ଅଧିକାରୀଙ୍କ ସହ ହେବାକୁ ଯାଉଥିବା ନିର୍ବାଚନୀ |
|
ଯୁଦ୍ଧ ଅବସରରେ ଭାଜପାର ବିରୋଧୀ ଦଳର ନେତାଙ୍କୁ ଚିଠି ଲେଖିଛନ୍ତି ପଶ୍ଚିମବଙ୍ଗ |
|
ମୁଖ୍ୟମନ୍ତ୍ରୀ ମମତା ବାର୍ନାଜୀ। ଏହି ଚିଠି କଂଗ୍ରେସର ସୋନିଆ ଗାନ୍ଧୀଙ୍କ ସମେତ ପ୍ରମୁଖ ୧୦ |
|
ବିରୋଧୀ ଦଳର ନେତାଙ୍କୁ ବୁଧବାର ପଠା ଯାଇଛି। ଚଳିତ ବିଧାନସଭା ନିର୍ବାଚନ ପରେ ଭାଜପାକୁ |
|
ହଟାଇବା ପାଇଁ ଏକତ୍ରିତ ହୋଇ କେଉଁ ରଣନୀତି ଆପଣେଇବାକୁ ପଡ଼ିବ ସେ ସମ୍ପର୍କରେ ଉଲ୍ଲେଖ |
|
କରିଛନ୍ତି ତୃଣମୂଳ କଂଗ୍ରେସ (ଟିଏମ୍ସି) ସୁପ୍ରିମୋ। ଗଣତନ୍ତ୍ର ଉପରେ ଭାଜପାର ଆକ୍ରମଣ |
|
ବିରୋଧରେ ଏକତ୍ରିତ ହେବାର ସମୟ ଆସିଯାଇଛି। ଦେଶର ନାଗରିକଙ୍କ ପାଇଁ ଏକ ବିଶ୍ୱସନୀୟ ବିକଳ୍ପ |
|
ଉପସ୍ଥାପନ କରିବାକୁ ଚିଠିରେ ମମତା ଉଲ୍ଲେଖ କରିଛନ୍ତି। ଦିଲ୍ଲୀ ଗଭର୍ନରଙ୍କୁ ନିର୍ବାଚିତ |
|
ସରକାରଙ୍କଠାରୁ ଅଧିକ ଶକ୍ତି ପ୍ରଦାନ କରୁଥିବା ନୂଆ ବିବାଦୀୟ ଆଇନ ଭଳି ୭ଟି ବିବାଦୀୟ ଘଟଣା |
|
ତଥା ଆଇନ ସମ୍ପର୍କରେ ଚିଠିରେ ଉଲ୍ଲେଖ କରିଛନ୍ତି ମମତା। ସୋନିଆଙ୍କ ବ୍ୟତୀତ ନ୍ୟାଶନାଲିଷ୍ଟ |
|
କଂଗ୍ରେସ ପାର୍ଟି ମୁଖ୍ୟ ଶରଦ ପାଓ୍ବାର, ଡିଏମ୍କେର ଷ୍ଟାଲିନ, ଶିବ ସେନାର ଉଦ୍ଧବ ଠାକରେ, |
|
ଓ୍ବାଇଆରଏସ୍ର ଜଗନ ମୋହନ ରେଡ୍ଡୀ, ବିଜେଡି ସୁପ୍ରିମୋ ନବୀନ ପଟ୍ଟନାୟକ, ଟିଆରଏସ୍ର କେ. |
|
ଚନ୍ଦ୍ରଶେଖର ରାଓ, ସମାଜବାଦୀ ପାର୍ଟିର ଅଖିଳେଶ ଯାଦବ, ରାଷ୍ଟ୍ରୀୟ ଜନତା ଦଳର ତେଜସ୍ବୀ |
|
ଯାଦବ, ଆମ ଆଦମି ପାର୍ଟିର ଅରବିନ୍ଦ କେଜରିଓ୍ବାଲ ଓ ସିପିଆଇଏମ୍ଏଲର ଦୀପାଙ୍କର |
|
ଭଟ୍ଟଚାର୍ଯ୍ୟଙ୍କୁ ଏହି ଚିଠି ପଠାଯାଇଛି</s> |
|
example_title: summarize |
|
- text: >- |
|
context: ଯେଉଁମାନେ ଏଭଳି ଉପଲବ୍ଧତାର ପୂର୍ବାନୁମାନ କରିପାରିବେ ନାହିଁ ସେମାନଙ୍କ |
|
ତୁଳନାରେ ସେମାନେ ପରିବେଶଗତ ସମ୍ବଳକୁ (ଯେପରିକି ଆଲୋକ ଏବଂ ଖାଦ୍ୟ) ସର୍ବୋତ୍ତମ ଭାବେ |
|
ଉପଯୋଗ କରିପାରିବେ। question: କେଉଁ ଜୀବ ସର୍କାଡିଆନ ରିଦମ ବ୍ୟବହାର କରି ଏହାର ଲାଭ |
|
ଉଠାଇପାରିବ ଯାହା ଅନ୍ୟମାନେ କରିପାରିବେ ନାହିଁ? </s> |
|
example_title: Context-Based qa |
|
license: cc-by-sa-4.0 |
|
--- |
|
# Model Card for odia-t5-base |
|
![model image](https://adaptiverecs-web.s3.ap-south-1.amazonaws.com/my-test-data/Odia+T5.png) |
|
|
|
# Model Details |
|
|
|
## Model Description |
|
|
|
odia-t5-base is a multilingual Text-To-Text Transfer Transformer fine-tuned to perform downstream tasks in the Odia language. |
|
|
|
- **Developed by:** Mohammed Ashraf |
|
- **Model type:** Language model |
|
- **Language(s) (NLP):** Odia, English, Hindi |
|
- **License:** CC BY-NC-SA 4.0 |
|
- **Related Models:** [All MT5 Checkpoints](https://huggingface.co/models?search=mt5) |
|
|
|
# Uses |
|
|
|
## Direct Use and Downstream Use |
|
|
|
- Translate English to Odia. |
|
- Translate Hind to Odia. |
|
- Odia Sentence Summarization. |
|
- Question Answering in Odia. |
|
- Context-Based Question answering in Odia. |
|
|
|
|
|
### How to use |
|
|
|
``` |
|
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM |
|
|
|
tokenizer = AutoTokenizer.from_pretrained("mrSoul7766/odia-t5-base") |
|
model = AutoModelForSeq2SeqLM.from_pretrained("mrSoul7766/odia-t5-base") |
|
|
|
# Set maximum generation length |
|
max_length = 512 |
|
|
|
# Generate response with question as input |
|
input_ids = tokenizer.encode("answer: ଓଡ଼ିଶାରେ ଅଟ୍ଟାଳିକା ପାଇଁ ସର୍ବାଧିକ ଆସନ ସୀମା କ’ଣ?</s>", return_tensors="pt") |
|
output_ids = model.generate(input_ids, max_length=max_length) |
|
|
|
# Decode response |
|
response = tokenizer.decode(output_ids[0], skip_special_tokens=True) |
|
print(response) |
|
|
|
``` |
|
|
|
### Licensing Information |
|
|
|
This work is licensed under a |
|
[Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License][cc-by-nc-sa]. |
|
|
|
[![CC BY-NC-SA 4.0][cc-by-nc-sa-image]][cc-by-nc-sa] |
|
|
|
[cc-by-nc-sa]: http://creativecommons.org/licenses/by-nc-sa/4.0/ |
|
[cc-by-nc-sa-image]: https://licensebuttons.net/l/by-nc-sa/4.0/88x31.png |
|
[cc-by-nc-sa-shield]: https://img.shields.io/badge/License-CC%20BY--NC--SA%204.0-lightgrey.svg |
|
|
|
|
|
### Citation Information |
|
|
|
## Dataset |
|
``` |
|
@misc{OdiaGenAI, |
|
author = {Shantipriya Parida and Sambit Sekhar and Subhadarshi Panda and Soumendra Kumar Sahoo and Swateek Jena and Abhijeet Parida and Arghyadeep Sen and Satya Ranjan Dash and Deepak Kumar Pradhan}, |
|
title = {OdiaGenAI: Generative AI and LLM Initiative for the Odia Language}, |
|
year = {2023}, |
|
publisher = {Hugging Face}, |
|
journal = {Hugging Face repository}, |
|
howpublished = {\url{https://huggingface.co/OdiaGenAI}}, |
|
} |
|
``` |
|
## Model |
|
``` |
|
@misc{mrSoul7766, |
|
author = {Mohammed Ashraf}, |
|
title = {odia-t5-base}, |
|
year = {2024}, |
|
note = {Licensed under Attribution-NonCommercial-ShareAlike 4.0 International}, |
|
} |
|
``` |