Spaces:

AstroMLab
/

AstroSage-8B

Runtime error

Tijmen2 commited on Nov 18, 2024

Commit

a65b868

verified ·

1 Parent(s): d17e177

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,18 +1,23 @@
 import spaces
 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer
-from huggingface_hub import hf_hub_download
 import torch
 import random
-# Load model and tokenizer from Hugging Face
-model_name = "AstroMLab/AstroSage-8B-GGUF"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(
     model_name,
     torch_dtype=torch.float16,
-    device_map="auto"
 )
 streamer = TextStreamer(tokenizer)
 # Placeholder responses for when context is empty

 import spaces
 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer
 import torch
 import random
+# Define model parameters for 8-bit quantized loading
+model_name = "AstroMLab/AstroSage-8B"
+# Load the tokenizer
 tokenizer = AutoTokenizer.from_pretrained(model_name)
+# Load the model with 8-bit quantization using bitsandbytes
 model = AutoModelForCausalLM.from_pretrained(
     model_name,
     torch_dtype=torch.float16,
+    load_in_8bit=True,               # Enable 8-bit quantization
+    device_map="auto"                # Automatically assign layers to available GPUs
 )
 streamer = TextStreamer(tokenizer)
 # Placeholder responses for when context is empty