Spaces:

Faizal2805
/

cyberbot

Runtime error

Faizal2805 commited on Mar 20

Commit

bf01853

verified ·

1 Parent(s): 958c61e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,15 +1,38 @@
 from fastapi import FastAPI
 from pydantic import BaseModel
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
 # Load model and tokenizer
-MODEL_NAME = "meta-llama/Llama-3.2-1B"  # Replace with your model
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
 model = AutoModelForCausalLM.from_pretrained(MODEL_NAME, torch_dtype=torch.float16)
 def generate_response(prompt: str):
     inputs = tokenizer(prompt, return_tensors="pt")
     outputs = model.generate(**inputs, max_length=200)
     return tokenizer.decode(outputs[0], skip_special_tokens=True)

 from fastapi import FastAPI
 from pydantic import BaseModel
 from transformers import AutoModelForCausalLM, AutoTokenizer
+from datasets import load_dataset
 import torch
 # Load model and tokenizer
+MODEL_NAME = "meta-llama/Llama-3.2-1B"  # Replace with your fine-tuned model
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
 model = AutoModelForCausalLM.from_pretrained(MODEL_NAME, torch_dtype=torch.float16)
+# Load AWS-Bot dataset
+DATASET_NAME = "Faizal2805/cyberbot"  # Replace with your dataset
+dataset = load_dataset(DATASET_NAME, split="train")
+def get_dataset_response(prompt: str):
+    """
+    Check if the user's input matches a dataset entry and return a predefined response.
+    If no match is found, return None.
+    """
+    for example in dataset:
+        if example["text"].startswith(f"<s>[INST] {prompt} [/INST]"):
+            return example["text"].split("</s>")[-1].strip()
+    return None
 def generate_response(prompt: str):
+    """
+    Generate a response from the dataset if available; otherwise, use the model.
+    """
+    dataset_response = get_dataset_response(prompt)
+    if dataset_response:
+        return dataset_response  # Return predefined dataset response
+    # Fallback to model-based response
     inputs = tokenizer(prompt, return_tensors="pt")
     outputs = model.generate(**inputs, max_length=200)
     return tokenizer.decode(outputs[0], skip_special_tokens=True)