Spaces:

hienbm
/

chatbot

Sleeping

hienbm commited on Jul 5, 2024

Commit

5dc4a5d

verified ·

1 Parent(s): 0d265f0

Upload app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -32,7 +32,7 @@ api_token = os.getenv("API_TOKEN")
 os.environ["PYTORCH_CUDA_ALLOC_CONF"] = "max_split_size_mb:15000"
-model_id = "google/gemma-2-9b-it"
 quantization_config = BitsAndBytesConfig(load_in_4bit=True)
 tokenizer = AutoTokenizer.from_pretrained(

 os.environ["PYTORCH_CUDA_ALLOC_CONF"] = "max_split_size_mb:15000"
+model_id = "mistralai/Mixtral-8x7B-Instruct-v0.1"
 quantization_config = BitsAndBytesConfig(load_in_4bit=True)
 tokenizer = AutoTokenizer.from_pretrained(