test / app.py
joermd's picture
Update app.py
d0f2261 verified
raw
history blame
2.49 kB
# app.py
from flask import Flask, send_file, request, jsonify
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch
import gradio as gr
app = Flask(__name__)
# تحميل النموذج
model = None
tokenizer = None
def load_model():
global model, tokenizer
if model is None:
print("جاري تحميل النموذج...")
tokenizer = AutoTokenizer.from_pretrained("amd/AMD-OLMo-1B")
model = AutoModelForCausalLM.from_pretrained(
"amd/AMD-OLMo-1B",
torch_dtype=torch.float16,
device_map="auto"
)
print("تم تحميل النموذج بنجاح!")
def generate_response(prompt):
"""Generate response from the model"""
global model, tokenizer
try:
if model is None:
load_model()
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
with torch.no_grad():
outputs = model.generate(
**inputs,
max_length=200,
num_return_sequences=1,
temperature=0.7,
top_p=0.9,
repetition_penalty=1.2,
pad_token_id=tokenizer.eos_token_id
)
response = tokenizer.decode(outputs[0], skip_special_tokens=True)
return response.replace(prompt, "").strip()
except Exception as e:
print(f"خطأ في توليد الرد: {str(e)}")
return "عذراً، حدث خطأ في معالجة رسالتك."
@app.route('/')
def home():
return send_file('index.html')
@app.route('/api/chat', methods=['POST'])
def chat():
try:
data = request.json
if not data:
return jsonify({"response": "لم يتم استلام أي بيانات"}), 400
user_message = data.get('message', '')
if not user_message:
return jsonify({"response": "الرسالة فارغة"}), 400
print(f"رسالة مستلمة: {user_message}")
response = generate_response(user_message)
print(f"الرد: {response}")
return jsonify({"response": response})
except Exception as e:
print(f"خطأ في معالجة الرسالة: {str(e)}")
return jsonify({"response": "عذراً، حدث خطأ في معالجة رسالتك"}), 500
if __name__ == "__main__":
# إذا كنت تريد تشغيل التطبيق محلياً
app.run()