Spaces:

cambioml
/

parser-leaderboard

Runtime error

App Files Files Community

jojortz commited on Aug 24, 2024

Commit

3966ab6

1 Parent(s): a9ae960

add exception handlers for GPT and Claude

Browse files

Files changed (1) hide show

extractors/model.py +55 -52

extractors/model.py CHANGED Viewed

@@ -188,36 +188,39 @@ class GPTModel(Model):
             str: The extracted data.
         """
-        pdf_preprocessor = PdfPreprocessor()
-        gpt_postprocessor = GPTPostprocessor()
-        file_contents = pdf_preprocessor.run(file_path)
-        contents = []
-        for content in file_contents:
-            contents.append(
-            {
-            "type": "image_url",
-            "image_url": {
-                "url": f"data:image/jpeg;base64,{content}",
-            },
-            })
-        messages = [
-            {
-            "role": "user",
-            "content": [
-                {"type": "text", "text": "Convert this image to markdown"},
-                *contents,
-            ],
-            }
-        ]
-        response = self._client.chat.completions.create(
-            model=self.MODEL,
-            messages=messages,
-        )
-        return gpt_postprocessor.run(response.choices[0].message.content)
 class ClaudeModel(Model):
     BASE_URL = "http://103.114.163.134:3000/v1/"
@@ -247,31 +250,31 @@ class ClaudeModel(Model):
             str: The extracted data.
         """
-        prompt = "Convert this image to markdown."
-        pdf_preprocessor = PdfPreprocessor()
-        claude_postprocessor = ClaudePostprocessor()
-        file_contents = pdf_preprocessor.run(file_path)
-        contents = []
-        for content in file_contents:
-            contents.append(
-                {
-                    "type": "image",
-                    "source": {
-                        "type": "base64",
-                        "media_type": "image/jpeg",
-                        "data": content,
-                    }
-                })
-        messages = [
-            {"role": "user", "content": [
-                {"type": "text", "text": prompt},
-                *contents,
-            ]}
-        ]
         try:
             response = self._client.messages.create(
                 model="claude-3-5-sonnet-20240620", max_tokens=1024, messages=messages
             )

             str: The extracted data.
         """
+        try:
+            pdf_preprocessor = PdfPreprocessor()
+            gpt_postprocessor = GPTPostprocessor()
+            file_contents = pdf_preprocessor.run(file_path)
+            contents = []
+            for content in file_contents:
+                contents.append(
+                {
+                "type": "image_url",
+                "image_url": {
+                    "url": f"data:image/jpeg;base64,{content}",
+                },
+                })
+            messages = [
+                {
+                "role": "user",
+                "content": [
+                    {"type": "text", "text": "Convert this image to markdown"},
+                    *contents,
+                ],
+                }
+            ]
+            response = self._client.chat.completions.create(
+                model=self.MODEL,
+                messages=messages,
+            )
+            return gpt_postprocessor.run(response.choices[0].message.content)
+        except Exception as e:
+            print(f"Error processing input: {str(e)}")
+            return f"Error processing with GPTModel: {str(e)}"
 class ClaudeModel(Model):
     BASE_URL = "http://103.114.163.134:3000/v1/"
             str: The extracted data.
         """
         try:
+            prompt = "Convert this image to markdown."
+            pdf_preprocessor = PdfPreprocessor()
+            claude_postprocessor = ClaudePostprocessor()
+            file_contents = pdf_preprocessor.run(file_path)
+            contents = []
+            for content in file_contents:
+                contents.append(
+                    {
+                        "type": "image",
+                        "source": {
+                            "type": "base64",
+                            "media_type": "image/jpeg",
+                            "data": content,
+                        }
+                    })
+            messages = [
+                {"role": "user", "content": [
+                    {"type": "text", "text": prompt},
+                    *contents,
+                ]}
+            ]
             response = self._client.messages.create(
                 model="claude-3-5-sonnet-20240620", max_tokens=1024, messages=messages
             )