Spaces:

ramalMr
/

data_gen

Sleeping

ramalMr commited on Apr 3, 2024

Commit

290168b

verified ·

1 Parent(s): 08d8e2d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -19,13 +19,15 @@ def extract_sentences_from_excel(file):
     sentences = [s.strip() for s in sentences if s.strip() and s.strip() != 'nan']
     return sentences
 def save_to_json(data, filename="synthetic_data.json"):
     with open(filename, mode='w', encoding='utf-8') as file:
         json_data = []
         for item in data:
             generated_sentences = []
             confidence_scores = []
-            for match in re.finditer(r"{'generated_sentence': '(.+)', 'confidence_score': (\d+\.\d+)}", item['generated_data']):
                 generated_sentences.append(match.group(1))
                 confidence_scores.append(float(match.group(2)))
             json_data.append({

     sentences = [s.strip() for s in sentences if s.strip() and s.strip() != 'nan']
     return sentences
+import re
 def save_to_json(data, filename="synthetic_data.json"):
     with open(filename, mode='w', encoding='utf-8') as file:
         json_data = []
         for item in data:
             generated_sentences = []
             confidence_scores = []
+            for match in re.finditer(r"{'generated_sentence': '(.+?)', 'confidence_score': ([\d\.]+)}", item['generated_data']):
                 generated_sentences.append(match.group(1))
                 confidence_scores.append(float(match.group(2)))
             json_data.append({