Spaces:

joermd
/

test

Running

App Files Files Community

joermd commited on Nov 10, 2024

Commit

d0f2261

verified ·

1 Parent(s): df29062

Update app.py

Browse files

Files changed (1) hide show

app.py +26 -21

app.py CHANGED Viewed

@@ -2,25 +2,33 @@
 from flask import Flask, send_file, request, jsonify
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
-from functools import lru_cache
-from flask_cors import CORS  # إضافة دعم CORS
 app = Flask(__name__)
-CORS(app)  # تفعيل CORS للسماح بالاتصال
-# تحميل النموذج - نقوم بتحميله مرة واحدة عند بدء التطبيق
-print("جاري تحميل النموذج...")
-tokenizer = AutoTokenizer.from_pretrained("amd/AMD-OLMo-1B")
-model = AutoModelForCausalLM.from_pretrained(
-    "amd/AMD-OLMo-1B",
-    torch_dtype=torch.float16,
-    device_map="auto"
-)
-print("تم تحميل النموذج بنجاح!")
 def generate_response(prompt):
     """Generate response from the model"""
     try:
         inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
         with torch.no_grad():
             outputs = model.generate(
@@ -40,14 +48,10 @@ def generate_response(prompt):
 @app.route('/')
 def home():
-    try:
-        return send_file('index.html')
-    except Exception as e:
-        print(f"خطأ في تحميل الصفحة: {str(e)}")
-        return "خطأ في تحميل الصفحة"
-@app.route('/message', methods=['POST'])
-def message():
     try:
         data = request.json
         if not data:
@@ -67,5 +71,6 @@ def message():
         print(f"خطأ في معالجة الرسالة: {str(e)}")
         return jsonify({"response": "عذراً، حدث خطأ في معالجة رسالتك"}), 500
-if __name__ == '__main__':
-    app.run(debug=True, port=5000)

 from flask import Flask, send_file, request, jsonify
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
+import gradio as gr
 app = Flask(__name__)
+# تحميل النموذج
+model = None
+tokenizer = None
+def load_model():
+    global model, tokenizer
+    if model is None:
+        print("جاري تحميل النموذج...")
+        tokenizer = AutoTokenizer.from_pretrained("amd/AMD-OLMo-1B")
+        model = AutoModelForCausalLM.from_pretrained(
+            "amd/AMD-OLMo-1B",
+            torch_dtype=torch.float16,
+            device_map="auto"
+        )
+        print("تم تحميل النموذج بنجاح!")
 def generate_response(prompt):
     """Generate response from the model"""
+    global model, tokenizer
     try:
+        if model is None:
+            load_model()
         inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
         with torch.no_grad():
             outputs = model.generate(
 @app.route('/')
 def home():
+    return send_file('index.html')
+@app.route('/api/chat', methods=['POST'])
+def chat():
     try:
         data = request.json
         if not data:
         print(f"خطأ في معالجة الرسالة: {str(e)}")
         return jsonify({"response": "عذراً، حدث خطأ في معالجة رسالتك"}), 500
+if __name__ == "__main__":
+    # إذا كنت تريد تشغيل التطبيق محلياً
+    app.run()