Spaces:

somosnlp-hackathon-2023
/

learning-assistance

Runtime error

Alberto Carmona commited on Mar 30, 2023

Commit

47d82ab

1 Parent(s): f90a30f

Setn env var for cuda

Files changed (1) hide show

functions.py CHANGED Viewed

@@ -1,9 +1,13 @@
 import requests
-from bs4 import BeautifulSoup
 import torch
-from peft import PeftModel, PeftConfig
 from transformers import AutoModelForCausalLM, AutoTokenizer, GenerationConfig
 generation_config = GenerationConfig(temperature=.8,
                                      top_p=0.75,
@@ -27,10 +31,10 @@ def summarize_text(text: str):
     batch = tokenizer(input_text, return_tensors='pt')
     print(['summarize_text', 'generating'])
     with torch.cuda.amp.autocast():
-        output_tokens = model.generate(**batch,
-                                    max_new_tokens=256,
-                                    generation_config=generation_config
-                                    )
     output = tokenizer.decode(output_tokens[0], skip_special_tokens=True)
     print(['summarize_text', 'end'])
     return output
@@ -50,4 +54,5 @@ def load_model(peft_model_id):
     return model, tokenizer
-model, tokenizer = load_model("hackathon-somos-nlp-2023/opt-6.7b-lora-sag-t3000-v300-v2")

+import os
 import requests
 import torch
+from bs4 import BeautifulSoup
+from peft import PeftConfig, PeftModel
 from transformers import AutoModelForCausalLM, AutoTokenizer, GenerationConfig
+os.environ["CUDA_VISIBLE_DEVICES"] = "0"
 generation_config = GenerationConfig(temperature=.8,
                                      top_p=0.75,
     batch = tokenizer(input_text, return_tensors='pt')
     print(['summarize_text', 'generating'])
     with torch.cuda.amp.autocast():
+        output_tokens = model.generate(**batch,
+                                       max_new_tokens=256,
+                                       generation_config=generation_config
+                                       )
     output = tokenizer.decode(output_tokens[0], skip_special_tokens=True)
     print(['summarize_text', 'end'])
     return output
     return model, tokenizer
+model, tokenizer = load_model(
+    "hackathon-somos-nlp-2023/opt-6.7b-lora-sag-t3000-v300-v2")