Qwen-VL-Chat

Paused

Tonic commited on Nov 14, 2023

Commit

f465778

1 Parent(s): 968fe0b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,6 +1,5 @@
 import transformers
 from transformers import AutoConfig, AutoTokenizer, AutoModelForCausalLM
-from peft import PeftModel, PeftConfig
 import torch
 import gradio as gr
 import json
@@ -59,7 +58,7 @@ class FalconChatBot:
         # Encode the conversation using the tokenizer
         input_ids = tokenizer.encode(conversation, return_tensors="pt", add_special_tokens=False)
         # Generate a response using the Falcon model
-        response = model.generate(input_ids=input_ids, max_length=max_length, use_cache=False, early_stopping=False, bos_token_id=model.config.bos_token_id, eos_token_id=model.config.eos_token_id, pad_token_id=peft_model.config.eos_token_id, temperature=0.4, do_sample=True)
         # Decode the generated response to text
         response_text = tokenizer.decode(response[0], skip_special_tokens=True)
         # Append the Falcon-like conversation to the history

 import transformers
 from transformers import AutoConfig, AutoTokenizer, AutoModelForCausalLM
 import torch
 import gradio as gr
 import json
         # Encode the conversation using the tokenizer
         input_ids = tokenizer.encode(conversation, return_tensors="pt", add_special_tokens=False)
         # Generate a response using the Falcon model
+        response = model.generate(input_ids=input_ids, max_length=max_length, use_cache=False, early_stopping=False, bos_token_id=model.config.bos_token_id, eos_token_id=model.config.eos_token_id, pad_token_id=model.config.eos_token_id, temperature=0.4, do_sample=True)
         # Decode the generated response to text
         response_text = tokenizer.decode(response[0], skip_special_tokens=True)
         # Append the Falcon-like conversation to the history