# modules/morphosyntax/morphosyntax_interface.py import streamlit as st from streamlit_float import * from streamlit_antd_components import * from streamlit.components.v1 import html import spacy from spacy import displacy import spacy_streamlit import pandas as pd import base64 import re # Importaciones locales from .morphosyntax_process import ( process_morphosyntactic_input, format_analysis_results, perform_advanced_morphosyntactic_analysis, get_repeated_words_colors, highlight_repeated_words, POS_COLORS, POS_TRANSLATIONS ) from ..utils.widget_utils import generate_unique_key from ..database.morphosyntax_iterative_mongo_db import ( store_student_morphosyntax_base, store_student_morphosyntax_iteration, get_student_morphosyntax_analysis, update_student_morphosyntax_analysis, delete_student_morphosyntax_analysis, get_student_morphosyntax_data ) import logging logger = logging.getLogger(__name__) ########################################################################### def initialize_arc_analysis_state(): """Inicializa el estado del análisis de arcos y el caché si no existen.""" if 'arc_analysis_state' not in st.session_state: st.session_state.arc_analysis_state = { 'base_id': None, # ID del análisis base (ObjectId) 'original_text': '', # Texto original 'original_analysis': None, # Dict con resultados del análisis base 'iteration_text': '', # Texto de iteración 'iteration_analysis': None,# Dict con resultados de la iteración 'analysis_count': 0 } logger.info("Estado de análisis de arcos inicializado") # Inicializar caché de análisis if 'analysis_cache' not in st.session_state: st.session_state.analysis_cache = {} logger.info("Caché de análisis inicializado") def reset_morpho_state(): """Resetea el estado del análisis morfosintáctico en sesión.""" if 'arc_analysis_state' in st.session_state: st.session_state.arc_analysis_state = { 'base_id': None, 'original_text': '', 'original_analysis': None, 'iteration_text': '', 'iteration_analysis': None, 'analysis_count': 0 } def display_original_analysis(container, analysis, lang_code, morpho_t): """Muestra el análisis original en el contenedor especificado.""" with container: st.subheader("Análisis Original") display_morphosyntax_results(analysis, lang_code, morpho_t) def display_iteration_analysis(container, analysis, lang_code, morpho_t): """Muestra el análisis de cambios en el contenedor especificado.""" with container: st.subheader("Análisis de Cambios") display_morphosyntax_results(analysis, lang_code, morpho_t) def display_arc_diagram(doc, analysis): """Muestra un diagrama de arco sin título.""" try: for sent in doc.sents: svg_html = displacy.render( sent, style="dep", options={ "distance": 100, "arrow_spacing": 20, "word_spacing": 30 } ) # Ajustar tamaño y posición svg_html = svg_html.replace('height="375"', 'height="200"') svg_html = re.sub( r']*>', lambda m: m.group(0).replace('height="450"', 'height="300"'), svg_html ) svg_html = re.sub( r']*transform="translate\((\d+),(\d+)\)"', lambda m: f'{svg_html}' st.write(svg_html, unsafe_allow_html=True) except Exception as e: logger.error(f"Error en display_arc_diagram: {str(e)}") def cache_analysis_results(key, result): """Almacena resultados de análisis en caché.""" if 'analysis_cache' not in st.session_state: initialize_arc_analysis_state() st.session_state.analysis_cache[key] = result logger.info(f"Resultado almacenado en caché con clave: {key}") def get_cached_analysis(key): """Recupera resultados de análisis del caché.""" if 'analysis_cache' not in st.session_state: initialize_arc_analysis_state() return None return st.session_state.analysis_cache.get(key) def display_morphosyntax_interface(lang_code, nlp_models, morpho_t): """ Interfaz principal para el análisis morfosintáctico. """ try: # CSS para layout estable st.markdown(""" """, unsafe_allow_html=True) # Inicializar estados si no existen initialize_arc_analysis_state() # Crear subtabs subtabs = st.tabs([ "Análisis de Diagramas de Arco", "Análisis de Categorías", "Análisis Morfológico" ]) # -------------------- Subtab 0: Diagramas de Arco -------------------- with subtabs[0]: # Botón de reset col1, col2, col3 = st.columns([2, 1, 2]) with col1: if st.button("Nuevo Análisis", type="secondary", use_container_width=True): reset_morpho_state() # Forzar un refresco completo solo en este caso st.experimental_rerun() # Container principal para análisis base analysis_container = st.container() with analysis_container: # Entrada de texto original text_input_key = f"original_text_{st.session_state.arc_analysis_state['analysis_count']}" text_input = st.text_area( "Texto original", value=st.session_state.arc_analysis_state.get('original_text', ''), key=text_input_key, height=100 ) # Botón de análisis col1, col2, col3 = st.columns([2, 1, 2]) with col1: analyze_button = st.button( "Analizar Texto", type="primary", use_container_width=True ) # Procesar texto original if analyze_button and text_input.strip(): try: if not getattr(st.session_state, 'username', None): st.error("No se detectó username en session_state. Verifica tu login.") return doc = nlp_models[lang_code](text_input) analysis = perform_advanced_morphosyntactic_analysis( text_input, nlp_models[lang_code] ) # Guardar en BD (retornará ObjectId) base_id = store_student_morphosyntax_base( st.session_state.username, text_input, analysis['arc_diagrams'] ) if base_id: # Actualizar el estado en session_state st.session_state.arc_analysis_state.update({ 'base_id': base_id, # Guardamos el ObjectId 'original_text': text_input, 'original_analysis': analysis, 'analysis_count': st.session_state.arc_analysis_state['analysis_count'] + 1, # Reiniciamos la iteración 'iteration_text': '', 'iteration_analysis': None }) # Mostrar diagrama base display_arc_diagram(doc, analysis) # Línea divisora st.markdown('
', unsafe_allow_html=True) # Sección para la iteración st.subheader("Iteración / Cambios") with st.form("iteration_form"): # key para la iteración iteration_text_key = f"iteration_text_{st.session_state.arc_analysis_state['analysis_count']}" # En lugar de default = text_input, ahora dejamos vacío por defecto iteration_text = st.text_area( "Texto de iteración", value=st.session_state.arc_analysis_state.get('iteration_text', ''), key=iteration_text_key, height=100 ) # Botón de submit en el formulario col1, col2, col3 = st.columns([2,1,2]) with col1: submitted = st.form_submit_button( "Analizar Cambios", type="primary", use_container_width=True ) if submitted and iteration_text.strip(): try: doc_iter = nlp_models[lang_code](iteration_text) analysis_iter = perform_advanced_morphosyntactic_analysis( iteration_text, nlp_models[lang_code] ) iteration_id = store_student_morphosyntax_iteration( st.session_state.username, base_id, # este es ObjectId text_input, # Texto original iteration_text, # Texto de iteración analysis_iter['arc_diagrams'] ) if iteration_id: # Actualizamos el estado de la iteración st.session_state.arc_analysis_state.update({ 'iteration_text': iteration_text, 'iteration_analysis': analysis_iter }) # Mostrar diagrama de iteración display_arc_diagram(doc_iter, analysis_iter) except Exception as e: st.error("Error procesando iteración") logger.error(f"Error en iteración: {str(e)}") except Exception as e: st.error("Error procesando análisis base") logger.error(f"Error base: {str(e)}") # -------------------- Subtab 1: Análisis de Categorías ---------------- with subtabs[1]: st.info("Análisis de Categorías en desarrollo...") # -------------------- Subtab 2: Análisis Morfológico ------------------ with subtabs[2]: st.info("Análisis Morfológico en desarrollo...") except Exception as e: st.error("Error en la interfaz de morfosintaxis") logger.error(f"Error general en la interfaz: {str(e)}") def display_morphosyntax_results(result, lang_code, morpho_t): """ Muestra solo el diagrama de arco. Args: result: Diccionario con el documento procesado y su análisis lang_code: Código del idioma morpho_t: Diccionario de traducciones (opcional) """ if not result: return try: doc = result['doc'] sentences = list(doc.sents) for i, sent in enumerate(sentences): try: st.subheader(f"{morpho_t.get('sentence', 'Sentence')} {i+1}") svg_html = displacy.render( sent, style="dep", options={ "distance": 100, "arrow_spacing": 20, "word_spacing": 30 } ) svg_html = svg_html.replace('height="375"', 'height="200"') svg_html = re.sub( r']*>', lambda m: m.group(0).replace('height="450"', 'height="300"'), svg_html ) svg_html = re.sub( r']*transform="translate\((\d+),(\d+)\)"', lambda m: f'{svg_html}' st.write(svg_html, unsafe_allow_html=True) except Exception as exc: logger.error(f"Error mostrando diagrama de la oración {i}: {str(exc)}") continue except Exception as e: logger.error(f"Error en display_morphosyntax_results: {str(e)}")