Spaces:

markqiu
/

prinvest_mate

Sleeping

App Files Files Community

guest commited on Apr 11, 2023

Commit

066a302

1 Parent(s): 0a2a419

多用户使用同一个后端model

Browse files

Files changed (2) hide show

ChuanhuChatbot.py +27 -26
modules/models.py +43 -8

ChuanhuChatbot.py CHANGED Viewed

@@ -15,6 +15,8 @@ from modules.models import ModelManager
 gr.Chatbot.postprocess = postprocess
 PromptHelper.compact_text_chunks = compact_text_chunks
 with open("assets/custom.css", "r", encoding="utf-8") as f:
     customCSS = f.read()
@@ -22,7 +24,6 @@ with gr.Blocks(css=customCSS, theme=small_and_beautiful_theme) as demo:
     user_name = gr.State("")
     promptTemplates = gr.State(load_template(get_template_names(plain=True)[0], mode=2))
     user_question = gr.State("")
-    current_model = gr.State(ModelManager(model_name = MODELS[DEFAULT_MODEL], access_key = my_api_key))
     topic = gr.State("未命名对话历史记录")
@@ -264,7 +265,7 @@ with gr.Blocks(css=customCSS, theme=small_and_beautiful_theme) as demo:
     gr.Markdown(CHUANHU_DESCRIPTION)
     gr.HTML(FOOTER.format(versions=versions_html()), elem_id="footer")
     chatgpt_predict_args = dict(
-        fn=current_model.value.predict,
         inputs=[
             user_question,
             chatbot,
@@ -297,18 +298,18 @@ with gr.Blocks(css=customCSS, theme=small_and_beautiful_theme) as demo:
     )
     get_usage_args = dict(
-        fn=current_model.value.billing_info, inputs=None, outputs=[usageTxt], show_progress=False
     )
     load_history_from_file_args = dict(
-        fn=current_model.value.load_chat_history,
         inputs=[historyFileSelectDropdown, chatbot, user_name],
         outputs=[saveFileName, systemPromptTxt, chatbot]
     )
     # Chatbot
-    cancelBtn.click(current_model.value.interrupt, [], [])
     user_input.submit(**transfer_input_args).then(**chatgpt_predict_args).then(**end_outputing_args)
     user_input.submit(**get_usage_args)
@@ -317,14 +318,14 @@ with gr.Blocks(css=customCSS, theme=small_and_beautiful_theme) as demo:
     submitBtn.click(**get_usage_args)
     emptyBtn.click(
-        current_model.value.reset,
         outputs=[chatbot, status_display],
         show_progress=True,
     )
     emptyBtn.click(**reset_textbox_args)
     retryBtn.click(**start_outputing_args).then(
-        current_model.value.retry,
         [
             chatbot,
             use_streaming_checkbox,
@@ -338,13 +339,13 @@ with gr.Blocks(css=customCSS, theme=small_and_beautiful_theme) as demo:
     retryBtn.click(**get_usage_args)
     delFirstBtn.click(
-        current_model.value.delete_first_conversation,
         None,
         [status_display],
     )
     delLastBtn.click(
-        current_model.value.delete_last_conversation,
         [chatbot],
         [chatbot, status_display],
         show_progress=False
@@ -353,14 +354,14 @@ with gr.Blocks(css=customCSS, theme=small_and_beautiful_theme) as demo:
     two_column.change(update_doc_config, [two_column], None)
     # LLM Models
-    keyTxt.change(current_model.value.set_key, keyTxt, [status_display]).then(**get_usage_args)
     keyTxt.submit(**get_usage_args)
-    single_turn_checkbox.change(current_model.value.set_single_turn, single_turn_checkbox, None)
-    model_select_dropdown.change(current_model.value.get_model, [model_select_dropdown, lora_select_dropdown, keyTxt, temperature_slider, top_p_slider, systemPromptTxt], [status_display, lora_select_dropdown], show_progress=True)
-    lora_select_dropdown.change(current_model.value.get_model, [model_select_dropdown, lora_select_dropdown, keyTxt, temperature_slider, top_p_slider, systemPromptTxt], [status_display], show_progress=True)
     # Template
-    systemPromptTxt.change(current_model.value.set_system_prompt, [systemPromptTxt], None)
     templateRefreshBtn.click(get_template_names, None, [templateFileSelectDropdown])
     templateFileSelectDropdown.change(
         load_template,
@@ -377,14 +378,14 @@ with gr.Blocks(css=customCSS, theme=small_and_beautiful_theme) as demo:
     # S&L
     saveHistoryBtn.click(
-        current_model.value.save_chat_history,
         [saveFileName, chatbot, user_name],
         downloadFile,
         show_progress=True,
     )
     saveHistoryBtn.click(get_history_names, [gr.State(False), user_name], [historyFileSelectDropdown])
     exportMarkdownBtn.click(
-        current_model.value.export_markdown,
         [saveFileName, chatbot, user_name],
         downloadFile,
         show_progress=True,
@@ -394,16 +395,16 @@ with gr.Blocks(css=customCSS, theme=small_and_beautiful_theme) as demo:
     downloadFile.change(**load_history_from_file_args)
     # Advanced
-    max_context_length_slider.change(current_model.value.set_token_upper_limit, [max_context_length_slider], None)
-    temperature_slider.change(current_model.value.set_temperature, [temperature_slider], None)
-    top_p_slider.change(current_model.value.set_top_p, [top_p_slider], None)
-    n_choices_slider.change(current_model.value.set_n_choices, [n_choices_slider], None)
-    stop_sequence_txt.change(current_model.value.set_stop_sequence, [stop_sequence_txt], None)
-    max_generation_slider.change(current_model.value.set_max_tokens, [max_generation_slider], None)
-    presence_penalty_slider.change(current_model.value.set_presence_penalty, [presence_penalty_slider], None)
-    frequency_penalty_slider.change(current_model.value.set_frequency_penalty, [frequency_penalty_slider], None)
-    logit_bias_txt.change(current_model.value.set_logit_bias, [logit_bias_txt], None)
-    user_identifier_txt.change(current_model.value.set_user_identifier, [user_identifier_txt], None)
     default_btn.click(
         reset_default, [], [apihostTxt, proxyTxt, status_display], show_progress=True

 gr.Chatbot.postprocess = postprocess
 PromptHelper.compact_text_chunks = compact_text_chunks
+current_model = ModelManager(model_name = MODELS[DEFAULT_MODEL], access_key = my_api_key)
 with open("assets/custom.css", "r", encoding="utf-8") as f:
     customCSS = f.read()
     user_name = gr.State("")
     promptTemplates = gr.State(load_template(get_template_names(plain=True)[0], mode=2))
     user_question = gr.State("")
     topic = gr.State("未命名对话历史记录")
     gr.Markdown(CHUANHU_DESCRIPTION)
     gr.HTML(FOOTER.format(versions=versions_html()), elem_id="footer")
     chatgpt_predict_args = dict(
+        fn=current_model.predict,
         inputs=[
             user_question,
             chatbot,
     )
     get_usage_args = dict(
+        fn=current_model.billing_info, inputs=None, outputs=[usageTxt], show_progress=False
     )
     load_history_from_file_args = dict(
+        fn=current_model.load_chat_history,
         inputs=[historyFileSelectDropdown, chatbot, user_name],
         outputs=[saveFileName, systemPromptTxt, chatbot]
     )
     # Chatbot
+    cancelBtn.click(current_model.interrupt, [], [])
     user_input.submit(**transfer_input_args).then(**chatgpt_predict_args).then(**end_outputing_args)
     user_input.submit(**get_usage_args)
     submitBtn.click(**get_usage_args)
     emptyBtn.click(
+        current_model.reset,
         outputs=[chatbot, status_display],
         show_progress=True,
     )
     emptyBtn.click(**reset_textbox_args)
     retryBtn.click(**start_outputing_args).then(
+        current_model.retry,
         [
             chatbot,
             use_streaming_checkbox,
     retryBtn.click(**get_usage_args)
     delFirstBtn.click(
+        current_model.delete_first_conversation,
         None,
         [status_display],
     )
     delLastBtn.click(
+        current_model.delete_last_conversation,
         [chatbot],
         [chatbot, status_display],
         show_progress=False
     two_column.change(update_doc_config, [two_column], None)
     # LLM Models
+    keyTxt.change(current_model.set_key, keyTxt, [status_display]).then(**get_usage_args)
     keyTxt.submit(**get_usage_args)
+    single_turn_checkbox.change(current_model.set_single_turn, single_turn_checkbox, None)
+    model_select_dropdown.change(current_model.get_model, [model_select_dropdown, lora_select_dropdown, keyTxt, temperature_slider, top_p_slider, systemPromptTxt], [status_display, lora_select_dropdown], show_progress=True)
+    lora_select_dropdown.change(current_model.get_model, [model_select_dropdown, lora_select_dropdown, keyTxt, temperature_slider, top_p_slider, systemPromptTxt], [status_display], show_progress=True)
     # Template
+    systemPromptTxt.change(current_model.set_system_prompt, [systemPromptTxt], None)
     templateRefreshBtn.click(get_template_names, None, [templateFileSelectDropdown])
     templateFileSelectDropdown.change(
         load_template,
     # S&L
     saveHistoryBtn.click(
+        current_model.save_chat_history,
         [saveFileName, chatbot, user_name],
         downloadFile,
         show_progress=True,
     )
     saveHistoryBtn.click(get_history_names, [gr.State(False), user_name], [historyFileSelectDropdown])
     exportMarkdownBtn.click(
+        current_model.export_markdown,
         [saveFileName, chatbot, user_name],
         downloadFile,
         show_progress=True,
     downloadFile.change(**load_history_from_file_args)
     # Advanced
+    max_context_length_slider.change(current_model.set_token_upper_limit, [max_context_length_slider], None)
+    temperature_slider.change(current_model.set_temperature, [temperature_slider], None)
+    top_p_slider.change(current_model.set_top_p, [top_p_slider], None)
+    n_choices_slider.change(current_model.set_n_choices, [n_choices_slider], None)
+    stop_sequence_txt.change(current_model.set_stop_sequence, [stop_sequence_txt], None)
+    max_generation_slider.change(current_model.set_max_tokens, [max_generation_slider], None)
+    presence_penalty_slider.change(current_model.set_presence_penalty, [presence_penalty_slider], None)
+    frequency_penalty_slider.change(current_model.set_frequency_penalty, [frequency_penalty_slider], None)
+    logit_bias_txt.change(current_model.set_logit_bias, [logit_bias_txt], None)
+    user_identifier_txt.change(current_model.set_user_identifier, [user_identifier_txt], None)
     default_btn.click(
         reset_default, [], [apihostTxt, proxyTxt, status_display], show_progress=True

modules/models.py CHANGED Viewed

@@ -195,7 +195,7 @@ class OpenAIClient(BaseLLMModel):
                     chunk = json.loads(chunk[6:])
                 except json.JSONDecodeError:
                     print(f"JSON解析错误,收到的内容: {chunk}")
-                    error_msg+=chunk
                     continue
                 if chunk_length > 6 and "delta" in chunk["choices"][0]:
                     if chunk["choices"][0]["finish_reason"] == "stop":
@@ -216,7 +216,7 @@ class ChatGLM_Client(BaseLLMModel):
         import torch
         system_name = platform.system()
-        model_path=None
         if os.path.exists("models"):
             model_dirs = os.listdir("models")
             if model_name in model_dirs:
@@ -292,6 +292,7 @@ class LLaMA_Client(BaseLLMModel):
         from lmflow.pipeline.auto_pipeline import AutoPipeline
         from lmflow.models.auto_model import AutoModel
         from lmflow.args import ModelArguments, DatasetArguments, InferencerArguments
         model_path = None
         if os.path.exists("models"):
             model_dirs = os.listdir("models")
@@ -304,10 +305,33 @@ class LLaMA_Client(BaseLLMModel):
             # raise Exception(f"models目录下没有这个模型: {model_name}")
         if lora_path is not None:
             lora_path = f"lora/{lora_path}"
         self.max_generation_token = 1000
         pipeline_name = "inferencer"
-        model_args = ModelArguments(model_name_or_path=model_source, lora_model_path=lora_path, model_type=None, config_overrides=None, config_name=None, tokenizer_name=None, cache_dir=None, use_fast_tokenizer=True, model_revision='main', use_auth_token=False, torch_dtype=None, use_lora=False, lora_r=8, lora_alpha=32, lora_dropout=0.1, use_ram_optimized_load=True)
-        pipeline_args = InferencerArguments(local_rank=0, random_seed=1, deepspeed='configs/ds_config_chatbot.json', mixed_precision='bf16')
         with open(pipeline_args.deepspeed, "r") as f:
             ds_config = json.load(f)
@@ -374,7 +398,7 @@ class LLaMA_Client(BaseLLMModel):
         step = 1
         for _ in range(0, self.max_generation_token, step):
             input_dataset = self.dataset.from_dict(
-                {"type": "text_only", "instances": [{"text": context+partial_text}]}
             )
             output_dataset = self.inferencer.inference(
                 model=self.model,
@@ -404,6 +428,17 @@ class ModelManager:
         system_prompt=None,
     ) -> BaseLLMModel:
         msg = f"模型设置为了： {model_name}"
         model_type = ModelType.get_type(model_name)
         lora_selector_visibility = False
         lora_choices = []
@@ -451,7 +486,9 @@ class ModelManager:
         if dont_change_lora_selector:
             return msg
         else:
-            return msg, gr.Dropdown.update(choices=lora_choices, visible=lora_selector_visibility)
     def predict(self, *args):
         iter = self.model.predict(*args)
@@ -530,8 +567,6 @@ class ModelManager:
         self.model.set_single_turn(*args)
 if __name__ == "__main__":
     with open("config.json", "r") as f:
         openai_api_key = cjson.load(f)["openai_api_key"]

                     chunk = json.loads(chunk[6:])
                 except json.JSONDecodeError:
                     print(f"JSON解析错误,收到的内容: {chunk}")
+                    error_msg += chunk
                     continue
                 if chunk_length > 6 and "delta" in chunk["choices"][0]:
                     if chunk["choices"][0]["finish_reason"] == "stop":
         import torch
         system_name = platform.system()
+        model_path = None
         if os.path.exists("models"):
             model_dirs = os.listdir("models")
             if model_name in model_dirs:
         from lmflow.pipeline.auto_pipeline import AutoPipeline
         from lmflow.models.auto_model import AutoModel
         from lmflow.args import ModelArguments, DatasetArguments, InferencerArguments
         model_path = None
         if os.path.exists("models"):
             model_dirs = os.listdir("models")
             # raise Exception(f"models目录下没有这个模型: {model_name}")
         if lora_path is not None:
             lora_path = f"lora/{lora_path}"
+        self.lora_path = lora_path
         self.max_generation_token = 1000
         pipeline_name = "inferencer"
+        model_args = ModelArguments(
+            model_name_or_path=model_source,
+            lora_model_path=lora_path,
+            model_type=None,
+            config_overrides=None,
+            config_name=None,
+            tokenizer_name=None,
+            cache_dir=None,
+            use_fast_tokenizer=True,
+            model_revision="main",
+            use_auth_token=False,
+            torch_dtype=None,
+            use_lora=False,
+            lora_r=8,
+            lora_alpha=32,
+            lora_dropout=0.1,
+            use_ram_optimized_load=True,
+        )
+        pipeline_args = InferencerArguments(
+            local_rank=0,
+            random_seed=1,
+            deepspeed="configs/ds_config_chatbot.json",
+            mixed_precision="bf16",
+        )
         with open(pipeline_args.deepspeed, "r") as f:
             ds_config = json.load(f)
         step = 1
         for _ in range(0, self.max_generation_token, step):
             input_dataset = self.dataset.from_dict(
+                {"type": "text_only", "instances": [{"text": context + partial_text}]}
             )
             output_dataset = self.inferencer.inference(
                 model=self.model,
         system_prompt=None,
     ) -> BaseLLMModel:
         msg = f"模型设置为了： {model_name}"
+        if self.model is not None and model_name == self.model.model_name:
+            # 如果模型名字一样，那么就不用重新加载模型
+            # if (
+            #     lora_model_path is not None
+            #     and hasattr(self.model, "lora_path")
+            #     and lora_model_path == self.model.lora_path
+            #     or lora_model_path is None
+            #     and not hasattr(self.model, "lora_path")
+            # ):
+            logging.info(f"模型 {model_name} 已经加载，不需要重新加载")
+            return msg
         model_type = ModelType.get_type(model_name)
         lora_selector_visibility = False
         lora_choices = []
         if dont_change_lora_selector:
             return msg
         else:
+            return msg, gr.Dropdown.update(
+                choices=lora_choices, visible=lora_selector_visibility
+            )
     def predict(self, *args):
         iter = self.model.predict(*args)
         self.model.set_single_turn(*args)
 if __name__ == "__main__":
     with open("config.json", "r") as f:
         openai_api_key = cjson.load(f)["openai_api_key"]