Spaces:

tori29umai
/

AINovelChat

Runtime error

App Files Files Community

tori29umai commited on Aug 19, 2024

Commit

397e88b

verified ·

1 Parent(s): fae7c5b

Update app.py

Browse files

Files changed (1) hide show

app.py +16 -9

app.py CHANGED Viewed

@@ -28,13 +28,12 @@ if not os.path.exists("models"):
     os.makedirs("models")
 # 使用するモデルのファイル名を指定
-model_filename = "EZO-Common-9B-gemma-2-it.f16.gguf.gguf"
 model_path = os.path.join("models", model_filename)
 # モデルファイルが存在しない場合はダウンロード
 if not os.path.exists(model_path):
-    dl_guff_model("models", f"https://huggingface.co/Aratako/Ninja-v1-RP-expressive-v2-GGUF/resolve/main/{model_filename}")
 class ConfigManager:
     @staticmethod
@@ -228,8 +227,10 @@ class GenTextParams:
 class LlamaAdapter:
     def __init__(self, model_path, params, n_gpu_layers):
-        self.llm = Llama(model_path=model_path, n_ctx=params.chat_n_ctx, n_gpu_layers=n_gpu_layers)
         self.params = params
     def generate_text(self, text, author_description, gen_characters, gen_token_multiplier, instruction):
         max_tokens = int(gen_characters * gen_token_multiplier)
@@ -295,7 +296,6 @@ def load_model_gpu(model_type, model_path, n_gpu_layers, params):
     print(f"{model_type} モデル {model_path} のロードが完了しました。(n_gpu_layers: {n_gpu_layers})")
     return llama
 class CharacterMaker:
     def __init__(self):
         self.llama = None
@@ -309,8 +309,16 @@ class CharacterMaker:
     def load_model(self, model_type):
         with self.model_lock:
-            if self.current_model == model_type:
-                return
             self.model_loaded.clear()
             if self.llama:
@@ -318,8 +326,6 @@ class CharacterMaker:
                 self.llama = None
             try:
-                model_path = os.path.join(MODEL_DIR, self.settings[f'DEFAULT_{model_type.upper()}_MODEL'])
-                n_gpu_layers = self.settings[f'{model_type.lower()}_n_gpu_layers']
                 self.llama = load_model_gpu(model_type, model_path, n_gpu_layers, params)
                 self.current_model = model_type
                 self.model_loaded.set()
@@ -327,6 +333,7 @@ class CharacterMaker:
                 print(f"{model_type} モデルのロード中にエラーが発生しました: {str(e)}")
                 self.model_loaded.set()
     def generate_response(self, input_str):
         self.load_model('CHAT')
         if not self.model_loaded.wait(timeout=30) or not self.llama:

     os.makedirs("models")
 # 使用するモデルのファイル名を指定
+model_filename = "EZO-Common-9B-gemma-2-it.f16.gguf"
 model_path = os.path.join("models", model_filename)
 # モデルファイルが存在しない場合はダウンロード
 if not os.path.exists(model_path):
+    dl_guff_model("models", f"https://huggingface.co/MCZK/EZO-Common-9B-gemma-2-it-GGUF/resolve/main//{model_filename}")
 class ConfigManager:
     @staticmethod
 class LlamaAdapter:
     def __init__(self, model_path, params, n_gpu_layers):
+        self.model_path = model_path
         self.params = params
+        self.n_gpu_layers = n_gpu_layers
+        self.llm = Llama(model_path=model_path, n_ctx=params.chat_n_ctx, n_gpu_layers=n_gpu_layers)
     def generate_text(self, text, author_description, gen_characters, gen_token_multiplier, instruction):
         max_tokens = int(gen_characters * gen_token_multiplier)
     print(f"{model_type} モデル {model_path} のロードが完了しました。(n_gpu_layers: {n_gpu_layers})")
     return llama
 class CharacterMaker:
     def __init__(self):
         self.llama = None
     def load_model(self, model_type):
         with self.model_lock:
+            model_path = os.path.join(MODEL_DIR, self.settings[f'DEFAULT_{model_type.upper()}_MODEL'])
+            n_gpu_layers = self.settings[f'{model_type.lower()}_n_gpu_layers']
+            # 現在のモデルが既にロードされているか、同じ設定であるかチェック
+            if self.llama and self.current_model == model_type:
+                if (self.llama.model_path == model_path and
+                    self.llama.n_gpu_layers == n_gpu_layers):
+                    print(f"{model_type} モデルは既にロードされています。再ロードをスキップします。")
+                    self.model_loaded.set()
+                    return
             self.model_loaded.clear()
             if self.llama:
                 self.llama = None
             try:
                 self.llama = load_model_gpu(model_type, model_path, n_gpu_layers, params)
                 self.current_model = model_type
                 self.model_loaded.set()
                 print(f"{model_type} モデルのロード中にエラーが発生しました: {str(e)}")
                 self.model_loaded.set()
     def generate_response(self, input_str):
         self.load_model('CHAT')
         if not self.model_loaded.wait(timeout=30) or not self.llama: