Spaces:

SantanuBanerjee
/

TaxDirection

Sleeping

SantanuBanerjee commited on Aug 4, 2024

Commit

61b7e96

verified ·

1 Parent(s): df711e3

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -229,8 +229,8 @@ def extract_problem_domains(df,
                             text_column='Problem_Description',
                             cluster_range=(10, 50),
                             top_words=17,
-                            # method='sentence_transformers'
-                            method='tfidf_kmeans'
                            ):
@@ -339,8 +339,8 @@ def nlp_pipeline(original_df, console_messages):
     # Domain Clustering
     try:
         domain_df, optimal_n_clusters = extract_problem_domains(processed_df)
-        print(f"Optimal clusters: {optimal_clusters}")
-        print(result_df.head())
         # console_messages.append(f"Optimal clusters: {optimal_n_clusters}")
         console_messages.append("NLP pipeline completed.")
@@ -348,8 +348,8 @@ def nlp_pipeline(original_df, console_messages):
     except Exception as e:
         # print(f"Error in extract_problem_domains: {e}")
         console_messages.append(f"Error in extract_problem_domains: {str(e)}")
-        # return processed_df, console_messages
-        return domain_df, console_messages
     # problem_clusters, problem_model = perform_clustering(processed_df['Problem_Description'], n_clusters=10)

                             text_column='Problem_Description',
                             cluster_range=(10, 50),
                             top_words=17,
+                            method='sentence_transformers'
+                            # method='tfidf_kmeans'
                            ):
     # Domain Clustering
     try:
         domain_df, optimal_n_clusters = extract_problem_domains(processed_df)
+        # print(f"Optimal clusters: {optimal_clusters}")
+        # print(result_df.head())
         # console_messages.append(f"Optimal clusters: {optimal_n_clusters}")
         console_messages.append("NLP pipeline completed.")
     except Exception as e:
         # print(f"Error in extract_problem_domains: {e}")
         console_messages.append(f"Error in extract_problem_domains: {str(e)}")
+        return processed_df, console_messages
+        # return domain_df, console_messages
     # problem_clusters, problem_model = perform_clustering(processed_df['Problem_Description'], n_clusters=10)