Spaces:

hprasath
/

image-processing

Sleeping

App Files Files Community

hprasath commited on Apr 24, 2024

Commit

d68099b

verified ·

1 Parent(s): dade12d

Update app.py

Browse files

Files changed (1) hide show

app.py +152 -0

app.py CHANGED Viewed

@@ -298,6 +298,158 @@ def extract_pdf_text_and_embedding():
         print(e)
         return jsonify({"error": str(list)}), 500
 # Route to get text description embeddings
 @cache.cached(timeout=300)
 @app.route('/getTextDescriptionEmbedding', methods=['POST'])

         print(e)
         return jsonify({"error": str(list)}), 500
+@cache.cached(timeout=300)
+@app.route('/extract_pdf_text_and_embedding1', methods=['POST'])
+def extract_pdf_text_and_embedding():
+    list = []
+    try:
+        list.append(1)
+        pdf_url = request.json.get("pdfUrl")
+        list.append(2)
+        print(1)
+        return jsonify({"content":str(list)}) , 200
+        # pages_info = "Error"
+        # try :
+        #     pages_info = seperate_image_text_from_pdf(pdf_url)
+        # except Exception as e:
+        #     print(e)
+        #     return jsonify({"error": "Failed to fetch the PDF from the URL"}), 500
+        # list.append(3)
+        # if(pages_info == "Error"):
+        #     return jsonify({"error": "Failed to fetch the PDF from the URL seperate_image_text_from_pdf "}), 500
+        # list.append(4)
+        # content = pdf_image_text_embedding_and_text_embedding(pages_info)
+        # if content == "Error":
+        #     return jsonify({"error": "An error occurred while processing the PDF"}), 500
+        # list.append(5)
+        # print(content)
+        # return jsonify({"content": content}), 200
+    except Exception as e:
+        print(e)
+        return jsonify({"error": str(list)}), 500
+@cache.cached(timeout=300)
+@app.route('/extract_pdf_text_and_embedding2', methods=['POST'])
+def extract_pdf_text_and_embedding():
+    list = []
+    try:
+        list.append(1)
+        pdf_url = request.json.get("pdfUrl")
+        list.append(2)
+        print(1)
+        return jsonify({"content":str(list)}) , 200
+        pages_info = "Error"
+        try :
+            pages_info = seperate_image_text_from_pdf(pdf_url)
+        except Exception as e:
+            return jsonify({"content":str(list)}) , 200
+        # list.append(3)
+        # if(pages_info == "Error"):
+        #     return jsonify({"error": "Failed to fetch the PDF from the URL seperate_image_text_from_pdf "}), 500
+        # list.append(4)
+        # content = pdf_image_text_embedding_and_text_embedding(pages_info)
+        # if content == "Error":
+        #     return jsonify({"error": "An error occurred while processing the PDF"}), 500
+        # list.append(5)
+        # print(content)
+        # return jsonify({"content": content}), 200
+    except Exception as e:
+        print(e)
+        return jsonify({"error": str(list)}), 500
+@cache.cached(timeout=300)
+@app.route('/extract_pdf_text_and_embedding3', methods=['POST'])
+def extract_pdf_text_and_embedding():
+    list = []
+    try:
+        list.append(1)
+        pdf_url = request.json.get("pdfUrl")
+        list.append(2)
+        print(1)
+        return jsonify({"content":str(list)}) , 200
+        pages_info = "Error"
+        try :
+            pages_info = seperate_image_text_from_pdf(pdf_url)
+        except Exception as e:
+            return jsonify({"content":str(list)}) , 200
+        list.append(3)
+        if(pages_info == "Error"):
+            return jsonify({"content":str(list)}) , 200
+        # list.append(4)
+        # content = pdf_image_text_embedding_and_text_embedding(pages_info)
+        # if content == "Error":
+        #     return jsonify({"error": "An error occurred while processing the PDF"}), 500
+        # list.append(5)
+        # print(content)
+        # return jsonify({"content": content}), 200
+    except Exception as e:
+        print(e)
+        return jsonify({"error": str(list)}), 500
+@cache.cached(timeout=300)
+@app.route('/extract_pdf_text_and_embedding4', methods=['POST'])
+def extract_pdf_text_and_embedding():
+    list = []
+    try:
+        list.append(1)
+        pdf_url = request.json.get("pdfUrl")
+        list.append(2)
+        print(1)
+        return jsonify({"content":str(list)}) , 200
+        pages_info = "Error"
+        try :
+            pages_info = seperate_image_text_from_pdf(pdf_url)
+        except Exception as e:
+            return jsonify({"content":str(list)}) , 200
+        list.append(3)
+        if(pages_info == "Error"):
+            return jsonify({"content":str(list)}) , 200
+        list.append(4)
+        content = pdf_image_text_embedding_and_text_embedding(pages_info)
+        if content == "Error":
+            return jsonify({"content":str(list)}) , 200
+        # list.append(5)
+        # print(content)
+        # return jsonify({"content": content}), 200
+    except Exception as e:
+        print(e)
+        return jsonify({"error": str(list)}), 500
+@cache.cached(timeout=300)
+@app.route('/extract_pdf_text_and_embedding5', methods=['POST'])
+def extract_pdf_text_and_embedding():
+    list = []
+    try:
+        list.append(1)
+        pdf_url = request.json.get("pdfUrl")
+        list.append(2)
+        print(1)
+        return jsonify({"content":str(list)}) , 200
+        pages_info = "Error"
+        try :
+            pages_info = seperate_image_text_from_pdf(pdf_url)
+        except Exception as e:
+            return jsonify({"content":str(list)}) , 200
+        list.append(3)
+        if(pages_info == "Error"):
+            return jsonify({"content":str(list)}) , 200
+        list.append(4)
+        content = pdf_image_text_embedding_and_text_embedding(pages_info)
+        if content == "Error":
+            return jsonify({"content":str(list)}) , 200
+        list.append(5)
+        print(content)
+        return jsonify({"content": content}), 200
+    except Exception as e:
+        print(e)
+        return jsonify({"error": str(list)}), 500
 # Route to get text description embeddings
 @cache.cached(timeout=300)
 @app.route('/getTextDescriptionEmbedding', methods=['POST'])