Spaces:

Pranay25
/

chatbot

Sleeping

Pranay25 commited on May 20

Commit

dabb465

verified ·

1 Parent(s): b85d243

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -63,21 +63,23 @@ def extract_attributes(extracted_text):
     print(f"Raw extracted text: '{extracted_text}'")
     print(f"Cleaned extracted text: '{cleaned_text}'")
-    # Patterns for extracting personal information
     patterns = {
-        "Name": r"Name\s*[:\-]?\s*([\w\s\-\.\',]+)(?=\s*(?:Age|Gender|Phone Number|Phone|Mobile|$|\n|\r\n|\Z))",
-        "Age": r"Age\s*[:\-]?\s*(\d{1,3})(?=\s*(?:Gender|Phone Number|Phone|Mobile|$|\n|\r\n|\Z))",
-        "Gender": r"Gender\s*[:\-]?\s*(Male|Female|Other)(?=\s*(?:Phone Number|Phone|Mobile|$|\n|\r\n|\Z))",
-        "Phone Number": r"(?:(?:Phone Number)|Phone|Mobile|Phonenumber)\s*[:\-]?\s*(?:\+91)?([6-9]\d{9})(?=\s*(?:$|\n|\r\n|\Z))"
     }
-    for readable_attr, pattern in patterns.items():
-        match = re.search(pattern, cleaned_text, re.IGNORECASE)
-        if match:
-            attributes[readable_attr] = match.group(1).strip()
-            print(f"Extracted {readable_attr}: '{attributes[readable_attr]}'")
-        else:
-            print(f"No match for {readable_attr} with pattern: {pattern}")
     if "Gender" in attributes:
         attributes["Gender"] = GENDER_MAPPING.get(attributes["Gender"], attributes["Gender"])

     print(f"Raw extracted text: '{extracted_text}'")
     print(f"Cleaned extracted text: '{cleaned_text}'")
+    # Patterns for extracting personal information (simplified for line-by-line matching)
     patterns = {
+        "Name": r"Name\s*[:\-]?\s*([\w\s\-\.\',]+)",
+        "Age": r"Age\s*[:\-]?\s*(\d{1,3})",
+        "Gender": r"Gender\s*[:\-]?\s*(Male|Female|Other)",
+        "Phone Number": r"(?:(?:Phone Number)|Phone|Mobile|Phonenumber)\s*[:\-]?\s*(?:\+91)?([6-9]\d{9})"
     }
+    # Process each line separately
+    lines = cleaned_text.split('\n')
+    for line in lines:
+        for readable_attr, pattern in patterns.items():
+            match = re.search(pattern, line, re.IGNORECASE)
+            if match:
+                attributes[readable_attr] = match.group(1).strip()
+                print(f"Extracted {readable_attr}: '{attributes[readable_attr]}' from line: '{line}'")
+                break  # Move to the next line once a match is found
     if "Gender" in attributes:
         attributes["Gender"] = GENDER_MAPPING.get(attributes["Gender"], attributes["Gender"])