hishab
/

titulm-mpt-1b-v1.0

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

sagorsarker commited on Apr 3

Commit

e9e1766

•

1 Parent(s): 54dbf4f

Update README.md

Files changed (1) hide show

README.md +7 -3

README.md CHANGED Viewed

@@ -22,13 +22,17 @@ Notable training configs:
 - vocab_size: 72000
 - attn_impl: flash
-__Training status__
 - Evaluation CrossEntropy Loss
-<img src="https://cdn-uploads.huggingface.co/production/uploads/5f40b34279c1ba4c353d0c7a/Mr0yAg9AfXTm15GATgSTN.png" alt="alt text" width="620" height="620">
 - Language Perplexity
-<img src="https://cdn-uploads.huggingface.co/production/uploads/5f40b34279c1ba4c353d0c7a/B-ZC1LfFZdCTO25Twcyth.png" alt="alt text" width="620" height="620">
 ## Datasets
 We add Bangla text datasets from several sources including

 - vocab_size: 72000
 - attn_impl: flash
+__Training evaluation status__
 - Evaluation CrossEntropy Loss
+  Final loss: 3.11
+  <img src="https://cdn-uploads.huggingface.co/production/uploads/5f40b34279c1ba4c353d0c7a/Mr0yAg9AfXTm15GATgSTN.png" alt="alt text" width="620" height="620">
 - Language Perplexity
+  Final Perplexity: 22.562
+  <img src="https://cdn-uploads.huggingface.co/production/uploads/5f40b34279c1ba4c353d0c7a/B-ZC1LfFZdCTO25Twcyth.png" alt="alt text" width="620" height="620">
 ## Datasets
 We add Bangla text datasets from several sources including