Spaces:

vsrinivas
/

ChatBot_by_SrinivasV

Sleeping

App Files Files Community

vsrinivas commited on Jul 15, 2024

Commit

e181201

verified ·

1 Parent(s): d7c09eb

Update app.py

Browse files

Files changed (1) hide show

app.py +33 -19

app.py CHANGED Viewed

@@ -4,24 +4,29 @@ import torch
 import gradio as gr
 desired_dtype = torch.bfloat16
-# checkpoint  = "tiiuae/falcon-40b-instruct"
-checkpoint ="tiiuae/falcon-7b-instruct"
-# checkpoint =  "tiiuae/falcon-7b"
-# checkpoint = "mistralai/Mixtral-8x7B-Instruct-v0.1"
-# checkpoint = "gpt2"
-# checkpoint = "amazon/FalconLite2"
 model = AutoModelForCausalLM.from_pretrained(
-    checkpoint, device_map="auto",
-    offload_folder="off_load",
-    trust_remote_code=True,
-    # torch_dtype="auto",
-)
-tokenizer = AutoTokenizer.from_pretrained(checkpoint,
-                                          trust_remote_code=True,
-                                          torch_dtype="auto",
-                                         )
 # model = "tiiuae/FalconLite2"
 # tokenizer = AutoTokenizer.from_pretrained(model,
@@ -32,14 +37,23 @@ pipeline = transformers.pipeline(
     "text-generation",
     model=model,
     tokenizer=tokenizer,
-    # use_safetensors=True,
-    # torch_dtype=torch.bfloat16,
     trust_remote_code=True,
     device_map="auto",
-    offload_folder="off_load",
-    # offload_state_dict = True,
 )
 # def format_chat_prompt(message, chat_history):
 #     prompt = ""
 #     for turn in chat_history:

 import gradio as gr
 desired_dtype = torch.bfloat16
+torch.set_default_dtype(torch.bfloat16)
+# checkpoint = "vsrinivas/falconlite2"
+checkpoint = "tiiuae/falcon-7b-instruct"
 model = AutoModelForCausalLM.from_pretrained(
+    # checkpoint, device_map="auto", offload_folder="offload", trust_remote_code=True, torch_dtype="auto")
+    checkpoint, device_map="auto", offload_folder="offload", trust_remote_code=True)
+# tokenizer = AutoTokenizer.from_pretrained(checkpoint, trust_remote_code=True, torch_dtype="auto")
+tokenizer = AutoTokenizer.from_pretrained(checkpoint, trust_remote_code=True)
+# model = AutoModelForCausalLM.from_pretrained(
+#     checkpoint, device_map="auto",
+#     # offload_folder="off_load",
+#     trust_remote_code=True,
+#     # torch_dtype="auto",
+# )
+# tokenizer = AutoTokenizer.from_pretrained(checkpoint,
+#                                           trust_remote_code=True,
+#                                           torch_dtype="auto",
+#                                          )
 # model = "tiiuae/FalconLite2"
 # tokenizer = AutoTokenizer.from_pretrained(model,
     "text-generation",
     model=model,
     tokenizer=tokenizer,
+    torch_dtype=torch.bfloat16,
     trust_remote_code=True,
     device_map="auto",
 )
+# pipeline = transformers.pipeline(
+#     "text-generation",
+#     model=model,
+#     tokenizer=tokenizer,
+#     # use_safetensors=True,
+#     # torch_dtype=torch.bfloat16,
+#     trust_remote_code=True,
+#     device_map="auto",
+#     offload_folder="off_load",
+#     # offload_state_dict = True,
+# )
 # def format_chat_prompt(message, chat_history):
 #     prompt = ""
 #     for turn in chat_history: