Spaces:

mgbam
/

sythenticdata

Sleeping

App Files Files Community

mgbam commited on Feb 9

Commit

81c7e29

verified ·

1 Parent(s): 4df2f52

Update app.py

Browse files

Files changed (1) hide show

app.py +45 -24

app.py CHANGED Viewed

@@ -4,8 +4,6 @@ import streamlit as st
 import pdfplumber
 import pandas as pd
 import sqlalchemy
-import time
-import concurrent.futures
 from typing import Any, Dict, List
 # Provider clients (ensure these are installed if you plan to use them)
@@ -19,11 +17,12 @@ try:
 except ImportError:
     groq = None
-# Hugging Face inference endpoint
 HF_API_URL = "https://api-inference.huggingface.co/models/"
 DEFAULT_TEMPERATURE = 0.1
 GROQ_MODEL = "mixtral-8x7b-32768"
 class AdvancedSyntheticDataGenerator:
     """
     Advanced Synthetic Data Generator that supports multiple input types,
@@ -190,8 +189,7 @@ class AdvancedSyntheticDataGenerator:
         temperature = st.session_state.config["temperature"]
         prompt = self.build_prompt()
-        st.info(f"Using provider **{provider_name}** with model **{model}** at temperature **{temperature:.2f}**")
         try:
             if provider_name == "HuggingFace":
                 response = self._huggingface_inference(client, prompt, model)
@@ -216,13 +214,13 @@ class AdvancedSyntheticDataGenerator:
         Inference for providers using an OpenAI-compatible API.
         """
         try:
-            st.write("Sending prompt to provider via standard inference...")
             result = client.chat.completions.create(
                 model=model,
                 messages=[{"role": "user", "content": prompt}],
                 temperature=temperature,
             )
-            st.write("Received standard inference result.")
             return result
         except Exception as e:
             self.log_error(f"Standard Inference Error: {e}")
@@ -230,7 +228,7 @@ class AdvancedSyntheticDataGenerator:
     def _huggingface_inference(self, client: Dict[str, Any], prompt: str, model: str) -> Any:
         """
-        Inference for Hugging Face Inference API.
         """
         try:
             st.write("Sending prompt to HuggingFace API...")
@@ -241,7 +239,7 @@ class AdvancedSyntheticDataGenerator:
                 timeout=30,
             )
             response.raise_for_status()
-            st.write("Received HuggingFace API response.")
             return response.json()
         except Exception as e:
             self.log_error(f"HuggingFace Inference Error: {e}")
@@ -270,6 +268,7 @@ class AdvancedSyntheticDataGenerator:
             self.log_error(f"Response Parsing Error: {e}")
             return ""
 # ===== Advanced UI Components =====
 def advanced_config_ui(generator: AdvancedSyntheticDataGenerator):
@@ -297,9 +296,10 @@ def advanced_config_ui(generator: AdvancedSyntheticDataGenerator):
                                     height=100)
         st.session_state.instructions = instructions
 def advanced_input_ui(generator: AdvancedSyntheticDataGenerator):
     """Display input data source options using tabs."""
-    st.header("Input Data Sources")
     tabs = st.tabs(["Text", "PDF", "CSV", "API", "Database"])
     with tabs[0]:
@@ -343,9 +343,10 @@ def advanced_input_ui(generator: AdvancedSyntheticDataGenerator):
             st.session_state.inputs.append(generator.handle_db({"connection": db_conn, "query": db_query}))
             st.success("Database input added!")
 def advanced_output_ui(generator: AdvancedSyntheticDataGenerator):
     """Display the generated synthetic data with output options."""
-    st.header("Synthetic Data Output")
     if st.session_state.synthetic_data:
         output_format = st.session_state.config.get("output_format", "plain_text")
         if output_format == "json":
@@ -361,8 +362,9 @@ def advanced_output_ui(generator: AdvancedSyntheticDataGenerator):
     else:
         st.info("No synthetic data generated yet.")
 def advanced_logs_ui():
-    """Display error logs and debugging information in an expandable section."""
     with st.expander("Error Logs & Debug Info", expanded=False):
         if st.session_state.error_logs:
             for log in st.session_state.error_logs:
@@ -370,33 +372,52 @@ def advanced_logs_ui():
         else:
             st.write("No logs yet.")
 # ===== Main Application =====
 def main() -> None:
     st.set_page_config(page_title="Advanced Synthetic Data Generator", layout="wide")
     generator = AdvancedSyntheticDataGenerator()
     advanced_config_ui(generator)
-    # Create main tabs for Input, Output, and Logs
-    main_tabs = st.tabs(["Input", "Output", "Logs"])
-    with main_tabs[0]:
         advanced_input_ui(generator)
-        if st.button("Clear Inputs"):
             st.session_state.inputs = []
-            st.success("Inputs cleared!")
-    with main_tabs[1]:
-        if st.button("Generate Synthetic Data"):
             with st.spinner("Generating synthetic data..."):
                 if generator.generate_synthetic_data():
-                    st.success("Data generated successfully!")
                 else:
                     st.error("Data generation failed. Check logs for details.")
         advanced_output_ui(generator)
-    with main_tabs[2]:
         advanced_logs_ui()
 if __name__ == "__main__":
     main()

 import pdfplumber
 import pandas as pd
 import sqlalchemy
 from typing import Any, Dict, List
 # Provider clients (ensure these are installed if you plan to use them)
 except ImportError:
     groq = None
+# Hugging Face Inference API endpoint
 HF_API_URL = "https://api-inference.huggingface.co/models/"
 DEFAULT_TEMPERATURE = 0.1
 GROQ_MODEL = "mixtral-8x7b-32768"
 class AdvancedSyntheticDataGenerator:
     """
     Advanced Synthetic Data Generator that supports multiple input types,
         temperature = st.session_state.config["temperature"]
         prompt = self.build_prompt()
+        st.info(f"Using **{provider_name}** with model **{model}** at temperature **{temperature:.2f}**")
         try:
             if provider_name == "HuggingFace":
                 response = self._huggingface_inference(client, prompt, model)
         Inference for providers using an OpenAI-compatible API.
         """
         try:
+            st.write("Sending prompt via standard inference...")
             result = client.chat.completions.create(
                 model=model,
                 messages=[{"role": "user", "content": prompt}],
                 temperature=temperature,
             )
+            st.write("Standard inference result received.")
             return result
         except Exception as e:
             self.log_error(f"Standard Inference Error: {e}")
     def _huggingface_inference(self, client: Dict[str, Any], prompt: str, model: str) -> Any:
         """
+        Inference for the Hugging Face Inference API.
         """
         try:
             st.write("Sending prompt to HuggingFace API...")
                 timeout=30,
             )
             response.raise_for_status()
+            st.write("HuggingFace API response received.")
             return response.json()
         except Exception as e:
             self.log_error(f"HuggingFace Inference Error: {e}")
             self.log_error(f"Response Parsing Error: {e}")
             return ""
 # ===== Advanced UI Components =====
 def advanced_config_ui(generator: AdvancedSyntheticDataGenerator):
                                     height=100)
         st.session_state.instructions = instructions
 def advanced_input_ui(generator: AdvancedSyntheticDataGenerator):
     """Display input data source options using tabs."""
+    st.subheader("Add Input Data")
     tabs = st.tabs(["Text", "PDF", "CSV", "API", "Database"])
     with tabs[0]:
             st.session_state.inputs.append(generator.handle_db({"connection": db_conn, "query": db_query}))
             st.success("Database input added!")
 def advanced_output_ui(generator: AdvancedSyntheticDataGenerator):
     """Display the generated synthetic data with output options."""
+    st.subheader("Synthetic Data Output")
     if st.session_state.synthetic_data:
         output_format = st.session_state.config.get("output_format", "plain_text")
         if output_format == "json":
     else:
         st.info("No synthetic data generated yet.")
 def advanced_logs_ui():
+    """Display error logs and debug information in an expandable section."""
     with st.expander("Error Logs & Debug Info", expanded=False):
         if st.session_state.error_logs:
             for log in st.session_state.error_logs:
         else:
             st.write("No logs yet.")
 # ===== Main Application =====
 def main() -> None:
     st.set_page_config(page_title="Advanced Synthetic Data Generator", layout="wide")
+    # Sidebar for advanced configuration
     generator = AdvancedSyntheticDataGenerator()
     advanced_config_ui(generator)
+    st.title("Advanced Synthetic Data Generator")
+    st.markdown(
+        """
+        Welcome! This application allows you to generate synthetic data from multiple input sources.
+        Use the sections below to add inputs, generate data, view outputs, and review logs.
+        """
+    )
+    # Input Data Section
+    with st.container():
+        st.header("1. Input Data Sources")
         advanced_input_ui(generator)
+        if st.button("Clear All Inputs"):
             st.session_state.inputs = []
+            st.success("All inputs have been cleared!")
+    # Generation Section with a clearly visible button
+    with st.container():
+        st.header("2. Generate Synthetic Data")
+        if st.button("Generate Synthetic Data", key="generate_button"):
             with st.spinner("Generating synthetic data..."):
                 if generator.generate_synthetic_data():
+                    st.success("Synthetic data generated successfully!")
                 else:
                     st.error("Data generation failed. Check logs for details.")
+    # Output Section
+    with st.container():
+        st.header("3. Synthetic Data Output")
         advanced_output_ui(generator)
+    # Logs Section
+    with st.container():
+        st.header("4. Error Logs & Debug Information")
         advanced_logs_ui()
 if __name__ == "__main__":
     main()