Wissotsky
/

TamiLM-Hebrew-Nano

Text Generation

Model card Files Files and versions Community

Wissotsky commited on 23 days ago

Commit

12048f2

•

1 Parent(s): fad2b81

fix formatting

Files changed (1) hide show

README.md +11 -11

README.md CHANGED Viewed

@@ -14,25 +14,25 @@ tags:
 # TamiLM Hebrew Nano
-A Modern Hebrew specialized LLM based on the RWKVv6 Architecture
-Trained only on Modern Hebrew datasets, with a custom vocabulary optimized for Modern Hebrew
 Trained at [Tel Aviv Makers Hackerspace](https://wiki.telavivmakers.org/)
 ### Params
-Layers | 12
-Depth  | 512
-Head size | 64
-Train ctx_len | 512
-Train tokens | 6,841,411,389
-Vocab size | 65536
 ### Train Compute
-All compute was performed on a single Nvidia P40 card
-Experiments: 62 hours 52 Minutes
-Training run: 208 hours 10 Minutes
 ### How to run

 # TamiLM Hebrew Nano
+A Modern Hebrew specialized LLM based on the RWKVv6 Architecture
+Trained only on Modern Hebrew datasets, with a custom vocabulary optimized for Modern Hebrew
 Trained at [Tel Aviv Makers Hackerspace](https://wiki.telavivmakers.org/)
 ### Params
+Layers `12`
+Depth  `512`
+Head size `64`
+Train ctx_len `512`
+Train tokens `6,841,411,389 (6 Billion)`
+Vocab size `65536`
 ### Train Compute
+All compute was performed on a single Nvidia P40 card
+Experiments: `62 hours 52 Minutes (2.6 days)`
+Training run: `208 hours 10 Minutes (8.6 days)`
 ### How to run