rinna
/

japanese-gpt-neox-small

Text Generation

text-generation-inference

Model card Files Files and versions Community

tianyuz commited on Aug 31, 2022

Commit

2b2c88d

•

1 Parent(s): f3cdc9a

Update README.md

Files changed (1) hide show

README.md +5 -5

README.md CHANGED Viewed

@@ -1,6 +1,6 @@
 ---
 language: ja
-thumbnail: https://github.com/rinnakk/japanese-gpt2/blob/master/rinna.png
 tags:
 - ja
 - japanese
@@ -11,9 +11,9 @@ tags:
 license: mit
 datasets:
 - cc100
-- wikipedia
-widget:
-- text: "生命、宇宙、そして万物についての究極の疑問の答えは"
 ---
 # japanese-gpt-neox-small
@@ -40,7 +40,7 @@ model = GPTNeoXForCausalLM.from_pretrained("rinna/japanese-gpt-neox-small")
 A 12-layer, 768-hidden-size transformer-based language model.
 # Training
-The model was trained on [Japanese CC-100](http://data.statmt.org/cc-100/ja.txt.xz), [Japanese C4](https://huggingface.co/datasets/c4), and [Japanese Wikipedia](https://dumps.wikimedia.org/other/cirrussearch) to optimize a traditional language modelling objective.
 # Tokenization
 The model uses a [sentencepiece](https://github.com/google/sentencepiece)-based tokenizer.

 ---
 language: ja
+thumbnail: https://github.com/rinnakk/japanese-pretrained-models/blob/master/rinna.png
 tags:
 - ja
 - japanese
 license: mit
 datasets:
 - cc100
+- Wikipedia
+- mc4
+inference: false
 ---
 # japanese-gpt-neox-small
 A 12-layer, 768-hidden-size transformer-based language model.
 # Training
+The model was trained on [Japanese CC-100](http://data.statmt.org/cc-100/ja.txt.xz), [Japanese C4](https://huggingface.co/datasets/mc4), and [Japanese Wikipedia](https://dumps.wikimedia.org/other/cirrussearch) to optimize a traditional language modelling objective.
 # Tokenization
 The model uses a [sentencepiece](https://github.com/google/sentencepiece)-based tokenizer.