Arambh
/

angika-llm-1b

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

Arambh commited on Oct 2, 2024

Commit

5bbc1fb

·

verified ·

1 Parent(s): e4a65d9

Update README.md

Files changed (1) hide show

README.md +18 -18

README.md CHANGED Viewed

@@ -24,38 +24,38 @@ This model sets a precedent for developing AI tools for other regional languages
 ## Model description
-!pip install transformers torch
-from transformers import AutoTokenizer, AutoModelForCausalLM
-import torch
-model_name = "Arambh/angika-llm-1b"
-tokenizer = AutoTokenizer.from_pretrained(model_name)
-model = AutoModelForCausalLM.from_pretrained(model_name)
-def generate_text(prompt, max_length=100, num_return_sequences=1):
-    # Tokenize input prompt
-    inputs = tokenizer(prompt, return_tensors="pt")
-    # Generate text
-    outputs = model.generate(
         **inputs,
         max_length=max_length,
         num_return_sequences=num_return_sequences,
         no_repeat_ngram_size=2,  # Prevents repetition
         early_stopping=True
-    )
-    # Decode and return the generated text
-    return [tokenizer.decode(output, skip_special_tokens=True) for output in outputs]
-if __name__ == "__main__":
-    prompt = "ये सब पहाड़ी पर पुरानो अभिलेख मिलै छै "
-    generated_text = generate_text(prompt, max_length=100)
-    for i, text in enumerate(generated_text):
         print(f"Generated Text {i+1}:\n{text}\n")
 ## Intended uses & limitations

 ## Model description
+    !pip install transformers torch
+    from transformers import AutoTokenizer, AutoModelForCausalLM
+    import torch
+    model_name = "Arambh/angika-llm-1b"
+    tokenizer = AutoTokenizer.from_pretrained(model_name)
+    model = AutoModelForCausalLM.from_pretrained(model_name)
+    def generate_text(prompt, max_length=100, num_return_sequences=1):
+        # Tokenize input prompt
+        inputs = tokenizer(prompt, return_tensors="pt")
+       # Generate text
+        outputs = model.generate(
         **inputs,
         max_length=max_length,
         num_return_sequences=num_return_sequences,
         no_repeat_ngram_size=2,  # Prevents repetition
         early_stopping=True
+        )
+       # Decode and return the generated text
+       return [tokenizer.decode(output, skip_special_tokens=True) for output in outputs]
+      if __name__ == "__main__":
+      prompt = "ये सब पहाड़ी पर पुरानो अभिलेख मिलै छै "
+      generated_text = generate_text(prompt, max_length=100)
+      for i, text in enumerate(generated_text):
         print(f"Generated Text {i+1}:\n{text}\n")
 ## Intended uses & limitations