# importando bibliotecas necessárias
import pandas as pd
import numpy as np
import gradio as gr
from gradio import components
from gradio import Interface
import xlsxwriter
from reportlab.lib.pagesizes import letter
from reportlab.platypus import SimpleDocTemplate, Paragraph
from reportlab.lib.styles import getSampleStyleSheet
import shutil

# Function to save results in a PDF file
def save_results_to_pdf(results_formatados, intervalo_confiança, valores_finais):
    doc = SimpleDocTemplate("resultados.pdf", pagesize=letter)
    styles = getSampleStyleSheet()
    
    # Create a list of elements to include in the PDF
    elements = []
    
    # Add the formatted results to the PDF
    formatted_results = Paragraph(results_formatados, styles["Normal"])
    elements.append(formatted_results)
    
    # Add the intervalo de confianca to the PDF
    confianca = Paragraph(intervalo_confiança, styles["Normal"])
    elements.append(confianca)
    
    # Add the valores calculados to the PDF
    calculados = Paragraph(valores_finais, styles["Normal"])
    elements.append(calculados)
    
    # Build the PDF
    doc.build(elements)

def renderizar_dataframe(df):
    try:
        # Renderize o DataFrame como uma tabela HTML com rolagem horizontal
        df_html = df.to_html(classes='table table-striped', 
                            table_id='planilha', 
                            escape=False)  # Não escapar caracteres especiais

        # Use uma div com estilo CSS para permitir a rolagem horizontal
        tabela_com_rolagem = f'<div style="overflow-x:auto;">{df_html}</div>'

        # Retorna a tabela com rolagem como HTML
        return tabela_com_rolagem
    except Exception as e:
        return f"Erro ao processar o DataFrame: {str(e)}"


# Função de avaliação do imóvel
def avaliacao_imovel(planilha, num_linhas_desejadas=10):
    # Lendo a aba 'avaliando' da planilha
    df_avaliando = pd.read_excel(planilha.name, 'avaliando')
    
    # Lendo a aba 'dados' da planilha, limitando o número de linhas
    df_dados = pd.read_excel(planilha.name, 'dados').iloc[:int(num_linhas_desejadas)]

        #-----------------#
    
    # fator de atratividade local (fal)
    df_transp = df_dados.copy()
    df_transp = df_transp[['Atratividade local']]
    df_transp['fal'] = round(df_avaliando['Atratividade local'][0] / df_transp['Atratividade local'], 2)
    df_transp = df_transp[['fal']]

        #-----------------#

    # fator de correção da área construída (fac)
    df_area_const = df_dados.copy()
    df_area_const = df_area_const[['Área Construída']]
    df_area_const['razao'] = (df_area_const['Área Construída'] / df_avaliando['Área Construída'][0])
    df_area_const['dif'] = abs(df_area_const['Área Construída'] - df_avaliando['Área Construída'][0])
    # 30% da área do terreno do avaliando
    x_ac = 0.3 * df_avaliando['Área Construída'][0]
    # coeficiente n conforme a diferença entre a área do avaliando e dos dados
    df_area_const['n'] = df_area_const['dif'].apply(lambda dif: 0.250 if dif <= x_ac else 0.125)
    df_area_const['fac'] = round((df_area_const['razao']) ** (df_area_const['n']), 2)
    df_area_const = df_area_const[['fac']]

        #-----------------#

    # fator de correção da área do terreno (fat)
    df_area_terreno = df_dados.copy()
    df_area_terreno = df_area_terreno[['Área Terreno']]
    df_area_terreno['razao'] = (df_area_terreno['Área Terreno'] / df_avaliando['Área Terreno'][0])
    df_area_terreno['dif'] = abs(df_area_terreno['Área Terreno'] - df_avaliando['Área Terreno'][0])
    # 30% da área do terreno do avaliando
    x_at = 0.3 * df_avaliando['Área Terreno'][0]
    # coeficiente n conforme a diferença entre a área do avaliando e dos dados
    df_area_terreno['n'] = df_area_terreno['dif'].apply(lambda dif: 0.250 if dif <= x_at else 0.125)
    df_area_terreno['fat'] = round((df_area_terreno['razao']) ** (df_area_terreno['n']), 2)
    df_area_terreno = df_area_terreno[['fat']]

        #-----------------#

    # fator idade aparente e conservação (fic)
    # dicionário padrão construtivo
    dict_ic = {
            'id<5_novo': 1.00,
            'id<5_bom': 0.95,
            'id<5_reparos simples': 0.80,
            'id<5_reparos importantes': 0.45,
            'id entre 6 e 10_novo': 0.95,
            'id entre 6 e 10_bom': 0.90,
            'id entre 6 e 10_reparos simples': 0.75,
            'id entre 6 e 10_reparos importantes': 0.40,
            'id entre 11 e 30_novo': 0.85,
            'id entre 11 e 30_bom': 0.80,
            'id entre 11 e 30_reparos simples': 0.65,
            'id entre 11 e 30_reparos importantes': 0.35,
            'id entre 31 e 50_novo': 0.55,
            'id entre 31 e 50_bom': 0.50,
            'id entre 31 e 50_reparos simples': 0.45,
            'id entre 31 e 50_reparos importantes': 0.25,
            'id>50_novo': 0.30,
            'id>50_bom': 0.20,
            'id>50_reparos simples': 0.15,
            'id>50_reparos importantes': 0.10
        }
    # cria dataframe apenas com as colunas necessárias a partir do dataframe dos dados
    df_idade_cons = df_dados.copy()
    df_idade_cons = df_idade_cons[['Idade aparente e conservação']]
    # cria dataframe apenas com as colunas necessárias a partir do dataframe do avaliando
    df_idade_cons_aval = df_avaliando.copy()
    df_idade_cons_aval = df_idade_cons_aval[['Idade aparente e conservação']]
    # Função para mapear os valores de idade aparente e conservação para cod_id_cons usando o dicionário
    def mapear_cod_id_cons(id_cons):
        return dict_ic.get(id_cons, 0)
    # Aplicando a função para criar a coluna cod_topo em df_dados e df_avaliando
    df_idade_cons['coef_ic'] = df_idade_cons['Idade aparente e conservação'].apply(mapear_cod_id_cons)
    df_idade_cons_aval['coef_ic'] = df_idade_cons_aval['Idade aparente e conservação'].apply(mapear_cod_id_cons)
    df_idade_cons['fic'] = round(df_idade_cons_aval['coef_ic'][0] / df_idade_cons['coef_ic'],2)
    df_idade_cons = df_idade_cons[['fic']]

        #-----------------#

    # fator padrão construtivo (fpd)
    # dicionário padrão construtivo
    dict_pad = {
        'baixo_residencial': 1.00,
        'médio/baixo_residencial': 1.15,
        'médio_residencial': 1.30,
        'médio/alto_residencial': 1.45,
        'alto_residencial': 1.65,
        'baixo_comercial': 1.00,
        'médio/baixo_comercial': 1.08,
        'médio_comercial': 1.15,
        'médio/alto_comercial': 1.25,
        'alto_comercial': 1.40
        }
    
    # cria dataframe apenas com as colunas necessárias a partir do dataframe dos dados
    df_padrao = df_dados.copy()
    df_padrao = df_padrao[['Padrão construtivo']]
    # cria dataframe apenas com as colunas necessárias a partir do dataframe do avaliando
    df_padrao_aval = df_avaliando.copy()
    df_padrao_aval = df_padrao_aval[['Padrão construtivo']]
    # Função para mapear os valores de padrão construtivo para cod_pad usando o dicionário
    def mapear_cod_pad(padrao):
        return dict_pad.get(padrao, 0)  # 0 como valor padrão caso a topografia não esteja no dicionário
    # Aplicando a função para criar a coluna cod_topo em df_dados e df_avaliando
    df_padrao['coef_pd'] = df_padrao['Padrão construtivo'].apply(mapear_cod_pad)
    df_padrao_aval['coef_pd'] = df_padrao_aval['Padrão construtivo'].apply(mapear_cod_pad)
    df_padrao['fpd'] = round(df_padrao_aval['coef_pd'][0]/df_padrao['coef_pd'],2)
    df_padrao = df_padrao[['fpd']]

        #-----------------#

    # fator vagas de estacionamento (fvg)
    df_vaga = df_dados[['Vagas']].copy()
    df_vaga_aval = df_avaliando[['Vagas']].copy()
    # Calcular a diferença entre as colunas 'Vagas' nos dois DataFrames
    df_vaga['dif'] = df_vaga['Vagas'] - df_vaga_aval['Vagas'][0]
    # Definir a função para o cálculo da coluna 'fvg'
    def calculate_fcg(dif, vagas):
        if dif == 0:
            return 1
        else:
            return 1 - 0.067 * dif
    # Aplicar a função para calcular a coluna 'fcg'
    df_vaga['fvg'] = round(df_vaga.apply(lambda row: calculate_fcg(row['dif'], row['Vagas']), axis=1), 2)
    df_vaga = df_vaga[['fvg']]

        #-----------------#

    # fator extra (à critério do avaliador) (fex)
    df_exc = df_dados.copy()
    df_exc = df_exc[['Coeficiente extra']]
    df_exc['fex'] = round(df_avaliando['Coeficiente extra'][0] / df_exc['Coeficiente extra'], 2)
    df_exc = df_exc[['fex']]

        #-----------------#

    # concatemando o dataframe principal com as dataframes dos fatores
    result = pd.concat([df_dados, df_transp, df_area_const, df_area_terreno, df_idade_cons, df_padrao, df_vaga, df_exc], axis=1)
    result['Valor_desc'] = round(result['Valor']*(result['fof']), 2)
    result['Vunit'] = round((result['Valor_desc']/result['Área Construída']), 2)
    result = result[['Atratividade local', 'Área Construída', 'Área Terreno',
       'Idade aparente e conservação', 'Padrão construtivo', 'Vagas',
       'Coeficiente extra', 'Valor', 'fof','Valor_desc', 'Vunit','fal', 'fac', 'fat', 'fic',
       'fpd', 'fvg', 'fex']]
    result['Vunit_hom'] = round(result['Vunit'] * result['fal'] * \
                                                result['fac'] * \
                                                result['fat'] * \
                                                result['fic'] * \
                                                result['fpd'] * \
                                                result['fvg'] * \
                                                result['fex'], 2)

    
    # RESULTADOS ESTATÍSTICOS INICIAIS 
    num = len(result)
    media = round(result['Vunit_hom'].mean(), 2)
    valor_hom_máximo = round(result['Vunit_hom'].max(), 2)
    valor_hom_mínimo = round(result['Vunit_hom'].min(), 2)
    limite_superior = round(media * 1.3 ,2)
    limite_inferior = round(media * 0.7 ,2)
    desvio_padrao = round(result['Vunit_hom'].std(), 2)
    coef_variacao = round((desvio_padrao / media)*100, 2)
    
    # CRITÉRIO DE CHAUVENET
    dict_vc = {
        2: 1.15,3: 1.38,4: 1.54,5: 1.65,6: 1.73,7: 1.80,8: 1.85,9: 1.91,10: 1.96,11: 1.99,
        12: 2.03,13: 2.06,14: 2.10,15: 2.13,16: 2.16,17: 2.18,18: 2.20,19: 2.21,20: 2.24,
        21: 2.26,22: 2.28,23: 2.30,24: 2.31,25: 2.33,26: 2.35,27: 2.36,28: 2.37,29: 2.38,
        30: 2.93
    }
    vc = dict_vc[num]
    vc
    result['z-score'] = abs((result['Vunit_hom'] - media) / desvio_padrao)
    result['Status'] = np.where(result['z-score'] > vc, 'rejeitado', 'aceito')

    # para gerar uma tabela na interface
    result_render = renderizar_dataframe(result)
    
    # DADOS REMOVIDOS
    outliers = result[result['Status'] == 'rejeitado']
    
    # REMOÇÃO DE OUTLIERS PELO CRITÉRIO DE CHAUVENET
    result = result[result['Status'] != 'rejeitado']
    
    # RESULTADOS ESTATÍSTICOS FINAIS 

    num = len(result)
    dados_outliers = len(outliers)
    media = round(result['Vunit_hom'].mean(), 2)
    valor_hom_máximo = round(result['Vunit_hom'].max(), 2)
    valor_hom_mínimo = round(result['Vunit_hom'].min(), 2)
    limite_superior = round(media * 1.3 ,2)
    limite_inferior = round(media * 0.7 ,2)
    desvio_padrao = round(result['Vunit_hom'].std(), 2)
    coef_variacao = round((desvio_padrao / media)*100, 2)
    # Crie uma string formatada com os RESULTADOS ESTATÍSTICOS FINAIS
    resultados_formatados = f"""
    Número de dados: {num} dados
    Valor Crítico (Chauvenet): {vc}
    Outliers: {dados_outliers} dado(s)
    Média saneada: {media} R$/m²
    Valor máximo: {valor_hom_máximo} R$/m²
    Valor mínimo: {valor_hom_mínimo} R$/m²
    Lim superior (Média*1,3): {limite_superior} R$/m²
    Lim inferior (Média*0,7): {limite_inferior} R$/m²
    Desvio padrão: {desvio_padrao} R$/m²
    Coeficiente variação: {coef_variacao} %
    """
    
    # INTEREVALO DE CONFIANÇA DE 80%
    # importando a tabela de t de student
    df_t = pd.read_excel('TABELAS.xlsx','t')
    # número de dados
    n =  result.shape[0]-1
    # "t" de student
    gl = df_t[df_t['gl (n-1)'] == n]
    tc = gl.iloc[0, 3]
    # limites infeiror e superior do IC de 80% e amplitude
    li_IC = round(media - tc * ((desvio_padrao/(num-1)**0.5)), 2)
    ls_IC = round(media + tc * ((desvio_padrao/(num-1)**0.5)), 2)
    A = round(ls_IC - li_IC, 2)
    A_perc = round((A / media)*100, 2)
    
    def calcular_grau(a):
        if a <= 30:
            return "Grau III"
        elif a <= 40:
            return "Grau II"
        elif a <= 50:
            return "Grau I"
        else:
            return "Fora dos critérios"
            
    precisao = calcular_grau(A_perc)
    
    # Crie uma string formatada com o INTEREVALO DE CONFIANÇA DE 80%
    intervalo_confiança = f"""
    t student: {tc}
    Média saneada: {media} R$/m²
    limite infeiror IC_80%: {li_IC} R$/m²
    limite superior IC_80%: {ls_IC} R$/m²
    Aplitude: {A} R$/m²
    Aplitude percentual: {A_perc} %
    Grau de Precisão: {precisao}
    """

    # VALOR CALCULADO A PARTIR DOS VALORES HOMOGENEIZADOS UTILIZANDO O CRITÉRIO DE CLASSAS D0 ABUNAHMAN
    # dividindo a amplitude em 3 classes
    C = round((A / 3), 2)
    # calculando os intervalos das 3 classes
    C1 = round(result[(result['Vunit_hom'] >= li_IC) & (result['Vunit_hom'] <= li_IC + C)]['Vunit_hom'].count(), 2)
    C2 = round(result[(result['Vunit_hom'] >= li_IC + C) & (result['Vunit_hom'] <= ls_IC - C)]['Vunit_hom'].count(), 2)
    C3 = round(result[(result['Vunit_hom'] >= ls_IC - C) & (result['Vunit_hom'] <= ls_IC)]['Vunit_hom'].count(), 2)
    # crinado listas com os valores encontrados nos intervalos
    list_C1 = result[(result['Vunit_hom'] >= li_IC) & (result['Vunit_hom'] <= li_IC + C)]['Vunit_hom'].tolist()
    list_C2 = result[(result['Vunit_hom'] >= li_IC + C) & (result['Vunit_hom'] <= ls_IC - C)]['Vunit_hom'].tolist()
    list_C3 = result[(result['Vunit_hom'] >= ls_IC - C) & (result['Vunit_hom'] <= ls_IC)]['Vunit_hom'].tolist()
 

    pC1 = round(sum(C1 * elemento for elemento in list_C1), 2)
    pC2 = round(sum(C2 * elemento for elemento in list_C2), 2)
    pC3 = round(sum(C3 * elemento for elemento in list_C3), 2)

    divisor = ((C1 * C1) if C1 != 0 else 0) +((C2 * C2) if C2 != 0 else 0) + ((C3 * C3) if C3 != 0 else 0)

    media_pond = round((pC1 + pC2 + pC3) / divisor, 2)


    # VALORES CALCULADOS
    Valor_imóvel = round(media * df_avaliando['Área Construída'], 2).item()
    LI = round(Valor_imóvel* 0.85, 2)
    LS = round(Valor_imóvel* 1.15, 2)
    
    Valor_imóvel_2 = round((media_pond) * df_avaliando['Área Construída'], 2).item()
    LI_classes = round(Valor_imóvel_2* 0.85, 2)
    LS_classes = round(Valor_imóvel_2* 1.15, 2)
    
    # Crie uma string formatada com os VALORES CALCULADOS
    valores_finais = f"""
    Área avaliando: {df_avaliando['Área Construída'].item()} m²
    ---------
    Valor (média simples): R$ {Valor_imóvel}
    LI: R$ {LI} 
    LS: R$ {LS}
    Vu (média simples): R$/m² {media}
    ---------
    Valor (critério classes): R$ {Valor_imóvel_2}
    LI: R$ {LI_classes} 
    LS: R$ {LS_classes}
    Vu (critério classes): R$/m² {media_pond}
    
    """
    #-----------------#
    
    # OUTPUTS
    
    # Crie um objeto ExcelWriter para escrever no arquivo Excel
    output_file = 'relatório.xlsx'
    with pd.ExcelWriter(output_file, engine='xlsxwriter') as writer:
        
        # Salve o DataFrame 'avaliando' na planilha 'relatório'
        df_avaliando.to_excel(writer, sheet_name='avaliando', index=False)
        
        #-----------------#
        
        # Salve o DataFrame 'result' na planilha 'relatório'
        df_dados.to_excel(writer, sheet_name='dados', index=False)
        
        #-----------------#
        
        # Salve o DataFrame 'dado_hom' na planilha 'relatório'
        result.to_excel(writer, sheet_name='dados_hom', index=False)
    
        #-----------------#
    
        # Salve o DataFrame 'outliers' na planilha 'relatório'
        outliers.to_excel(writer, sheet_name='outliers', index=False)
        
        #-----------------#
        
        # Crie um novo DataFrame com os resultados estatísticos
        result_estatisticos = pd.DataFrame({
            'Número de dados': [num],
            'Média': [media],
            'Valor homogeneizado máximo': [valor_hom_máximo],
            'Valor homogeneizado mínimo': [valor_hom_mínimo],
            'Limite superior (Média x 1,3)': [limite_superior],
            'Limite inferior (Média x 0,7)': [limite_inferior],
            'Desvio padrão': [desvio_padrao],
            'Coeficiente_variacao (%)': [coef_variacao]
        })

        # Transponha o DataFrame
        result_estatisticos = result_estatisticos.T.reset_index()
        # Defina os nomes das colunas do novo DataFrame
        result_estatisticos.columns = ['Nome da Coluna', 'Valor']
        result_estatisticos.to_excel(writer, sheet_name='resultados', index=False)

        #-----------------#
        
        # Crie um novo DataFrame com os resultados do IC
        result_ic = pd.DataFrame({
            'Número de dados': [n],
            't student': [tc],
            'Limite superior do IC de 80%': [ls_IC],
            'Limite inferior do IC de 80%': [li_IC],
            'Amplitude': [A],
            'Amplitude%':[A_perc],
            'Grau de Precisão': [precisao]
        })
        
        # Transponha o DataFrame
        result_ic = result_ic.T.reset_index()
        # Defina os nomes das colunas do novo DataFrame
        result_ic.columns = ['Nome da Coluna', 'Valor']
        result_ic.to_excel(writer, sheet_name='IC', index=False)
 
        #-----------------#

        # Crie um novo DataFrame com os resultados do cálculo das classes de Abunahman
        result_classes = pd.DataFrame({
            'C = Amplitude / 3': [round(C, 2)],
            'li_IC = limite inferior do IC': [round(li_IC, 2)],
            'li_IC + C = limite inferior do IC + C': [round(li_IC + C, 2)],
            'ls_IC - C = limite superior do IC + C': [round(ls_IC - C, 2)],
            'ls_IC = limite superior do IC': [round(ls_IC, 2)],
            'C1 = quantidade de dados na classe 1': [C1],
            'C2 = quantidade de dados na classe 2': [C2],
            'C3 = quantidade de dados na classe 3': [C3],
            'list_C1 = listagem de dados na classe 1': [list_C1],
            'list_C2 = listagem de dados na classe 2': [list_C2],
            'list_C3 = listagem de dados na classe 3': [list_C3],
            'Soma da multiplicação dos valor pelos pesos - classe 1': [pC1],
            'Soma da multiplicação dos valor pelos pesos - classe 2': [pC2],
            'Soma da multiplicação dos valor pelos pesos - classe 3': [pC3],
            'Divisor da somas das classes': [divisor],
            'Média ponderada': [media_pond]
        })

        
        # Transponha o DataFrame
        result_classes = result_classes.T.reset_index()
        # Defina os nomes das colunas do novo DataFrame
        result_classes.columns = ['Nome da Coluna', 'Valor']
        result_classes.to_excel(writer, sheet_name='classes', index=False)
        
         #-----------------#
        
           # Crie um novo DataFrame com os resultados do valor do imóvel
        result_valores = pd.DataFrame({
            'Valor (média simples): R$': [Valor_imóvel],
            'LI: R$': [LI], 
            'LS: R$': [LS],
            'Vu (média simples): R$/m²': [media],
            'Valor (critério classes) R$:': [Valor_imóvel_2],
            'Vu (critério classes): R$/m²': [media_pond],
            'LI_classes: R$': [LI_classes], 
            'LS_classes: R$': [LS_classes]  
        })
        
        
        # Transponha o DataFrame
        result_valores = result_valores.T.reset_index()
        # Defina os nomes das colunas do novo DataFrame
        result_valores.columns = ['Nome da Coluna', 'Valor']
        result_valores.to_excel(writer, sheet_name='valor', index=False)
        
        #-----------------#
    
        # Salve o DataFrame 'result' em uma planilha
        result.to_excel('relatório.xlsx', index=False)

        #-----------------#

        save_results_to_pdf(resultados_formatados, intervalo_confiança, valores_finais)
        
        #-----------------#

        # Retorna tanto a planilha quanto os resultados formatados
        return 'relatório.xlsx', 'resultados.pdf', result_render, resultados_formatados, intervalo_confiança, valores_finais
        
    
# Interface do Gradio com input como arquivo XLS ou XLSX
interface = gr.Interface(
    fn=avaliacao_imovel,
    inputs=[
        gr.components.File(label="Upload planilha", type="file"),
        gr.inputs.Number(label="Número de linhas desejadas", default=10),
    ],
    outputs=[
        gr.components.File(label="Download planilha"),
        gr.components.File(label="Download Relatório em PDF"),
        gr.outputs.HTML(label="Resultado Renderizado"),
        gr.components.Textbox(label="Resultados estatísticos"),
        gr.components.Textbox(label="Intervalo de confiança de 80%"),
        gr.components.Textbox(label="Valores Calculados"),
    
    ],
    live=True,
    capture_session=True,
    theme=gr.themes.Soft(),
    title="avaliaFACTOR",
    description="Aplicativo MCDDM com tratamento por fatores  /  Faça o upload de uma planilha XLS ou XLSX com os dados / Para um exemplo de estrutura de planilha, você pode baixar <a href='https://huggingface.co/spaces/DavidSB/avaliaFACTOR/resolve/main/dados_entrada_factor.xlsx' download='dados_entrada_factor.xlsx'>aqui</a>.")

# Executar o aplicativo Gradio
if __name__ == "__main__":
    interface.launch(debug=True)