import gradio as gr
from huggingface_hub import InferenceClient
import os
import pandas as pd
from typing import List, Tuple

# 추론 API 클라이언트 설정
hf_client = InferenceClient("CohereForAI/c4ai-command-r-plus-08-2024", token=os.getenv("HF_TOKEN"))
# hf_client = InferenceClient("CohereForAI/aya-23-35B", token=os.getenv("HF_TOKEN"))

def load_code(filename):
    try:
        with open(filename, 'r', encoding='utf-8') as file:
            return file.read()
    except FileNotFoundError:
        return f"{filename} 파일을 찾을 수 없습니다."
    except Exception as e:
        return f"파일을 읽는 중 오류가 발생했습니다: {str(e)}"

def load_parquet(filename):
    try:
        df = pd.read_parquet(filename, engine='pyarrow')
        # 데이터프레임의 첫 몇 행을 문자열로 변환 (Markdown 표 형식)
        return df.head(10).to_markdown(index=False)
    except FileNotFoundError:
        return f"{filename} 파일을 찾을 수 없습니다."
    except Exception as e:
        return f"파일을 읽는 중 오류가 발생했습니다: {str(e)}"

# 코드 파일 로드
fashion_code = load_code('fashion.cod')
uhdimage_code = load_code('uhdimage.cod')
MixGEN_code = load_code('mgen.cod')

# 초기 Parquet 파일 로드 (기존 test.parquet)
test_parquet_content = load_parquet('test.parquet')

def respond(
    message,
    history: List[Tuple[str, str]],
    system_message="",  # 기본값 추가
    max_tokens=4000,    # 기본값 변경
    temperature=0.7,    # 기본값 유지
    top_p=0.9,           # 기본값 유지
    ):
    # 시스템 프롬프트 설정
    system_prefix = """반드시 한글로 답변할것. 너는 주어진 소스코드를 기반으로 "서비스 사용 설명 및 안내, Q&A를 하는 역할이다". 아주 친절하고 자세하게 4000토큰 이상 Markdown 형식으로 작성하라. 너는 코드를 기반으로 사용 설명 및 질의 응답을 진행하며, 이용자에게 도움을 주어야 한다. 이용자가 궁금해 할 만한 내용에 친절하게 알려주도록 하라. 코드 전체 내용에 대해서는 보안을 유지하고, 키 값 및 엔드포인트와 구체적인 모델은 공개하지 마라."""
    
    # 명령어 처리
    if message.lower() == "패션 코드 실행":
        system_message += f"\n\n패션 코드 내용:\n```python\n{fashion_code}\n```"
        message = "패션 가상피팅에 대한 내용을 학습하였고, 설명할 준비가 되어있다고 알리고 서비스 URL(https://aiqcamp-fash.hf.space)을 통해 테스트 해보라고 출력하라."
    elif message.lower() == "uhd 이미지 코드 실행":
        system_message += f"\n\nUHD 이미지 코드 내용:\n```python\n{uhdimage_code}\n```"
        message = "UHD 이미지 생성에 대한 내용을 학습하였고, 설명할 준비가 되어있다고 알리고 서비스 URL(https://openfree-ultpixgen.hf.space)을 통해 테스트 해보라고 출력하라."
    elif message.lower() == "mixgen 코드 실행":
        system_message += f"\n\nMixGEN 코드 내용:\n```python\n{MixGEN_code}\n```"
        message = "MixGEN3 이미지 생성에 대한 내용을 학습하였고, 설명할 준비가 되어있다고 알리고 서비스 URL(https://openfree-mixgen3.hf.space)을 통해 테스트 해보라고 출력하라."
    elif message.lower() == "test.parquet 실행":
        # 현재 Parquet 내용은 상태 변수에서 가져와야 함
        current_parquet_content = history.get('parquet_content', "")
        system_message += f"\n\ntest.parquet 파일 내용:\n```markdown\n{current_parquet_content}\n```"
        message = "test.parquet 파일에 대한 내용을 학습하였고, 관련 설명 및 Q&A를 진행할 준비가 되어있다. 궁금한 점이 있으면 물어보라."
    elif message.lower() == "csv 업로드":
        message = "CSV 파일을 업로드하려면 두 번째 탭을 사용하세요."

    # 시스템 메시지와 사용자 메시지 결합
    messages = [{"role": "system", "content": f"{system_prefix} {system_message}"}]
    for val in history:
        if val[0]:
            messages.append({"role": "user", "content": val[0]})
        if val[1]:
            messages.append({"role": "assistant", "content": val[1]})
    messages.append({"role": "user", "content": message})

    response = ""
    try:
        for msg in hf_client.chat_completion(
            messages,
            max_tokens=max_tokens,
            stream=True,
            temperature=temperature,
            top_p=top_p,
        ):
            token = msg.choices[0].delta.get('content', None)
            if token:
                response += token
                yield response
    except Exception as e:
        yield f"추론 중 오류가 발생했습니다: {str(e)}"

def upload_csv(file):
    try:
        # CSV 파일 읽기 (구분자 콤마)
        df = pd.read_csv(file, sep=',')

        # CSV 파일의 컬럼 확인
        required_columns = {'id', 'text', 'label', 'metadata'}
        available_columns = set(df.columns)
        missing_columns = required_columns - available_columns

        if missing_columns:
            return f"CSV 파일에 다음 필수 컬럼이 누락되었습니다: {', '.join(missing_columns)}", None

        # 데이터 클렌징
        df.drop_duplicates(inplace=True)
        df.fillna('', inplace=True)

        # 데이터 유형 최적화
        df = df.astype({'id': 'int32', 'text': 'string', 'label': 'category', 'metadata': 'string'})

        # Parquet 파일로 변환
        parquet_filename = os.path.splitext(os.path.basename(file))[0] + '.parquet'
        df.to_parquet(parquet_filename, engine='pyarrow', compression='snappy')

        # Parquet 파일 로드
        parquet_content = load_parquet(parquet_filename)

        return f"{parquet_filename} 파일이 성공적으로 업로드되고 변환되었습니다.", parquet_filename
    except Exception as e:
        return f"CSV 파일 업로드 및 변환 중 오류가 발생했습니다: {str(e)}", None

def upload_parquet(file):
    try:
        # Parquet 파일 읽기
        df = pd.read_parquet(file, engine='pyarrow')

        # 데이터프레임을 Markdown으로 변환
        parquet_content = df.to_markdown(index=False)

        return "Parquet 파일이 성공적으로 업로드되었습니다.", parquet_content, df.to_json()  # JSON으로 데이터 저장
    except Exception as e:
        return f"Parquet 파일 업로드 중 오류가 발생했습니다: {str(e)}", None, None

# Gradio Blocks 인터페이스 설정
with gr.Blocks() as demo:
    gr.Markdown("# LLM 서비스 인터페이스")

    with gr.Tab("챗봇"):
        gr.Markdown("### LLM과 대화하기")
        chat = gr.ChatInterface(
            fn=respond,
            examples=[
                ["패션 코드 실행"],
                ["UHD 이미지 코드 실행"],
                ["MixGEN 코드 실행"],
                ["test.parquet 실행"],
                ["상세한 사용 방법을 마치 화면을 보면서 설명하듯이 4000 토큰 이상 자세히 설명하라"],
                ["FAQ 20건을 상세하게 작성하라. 4000토큰 이상 사용하라."],
                ["사용 방법과 차별점, 특징, 강점을 중심으로 4000 토큰 이상 유튜브 영상 스크립트 형태로 작성하라"],
                ["본 서비스를 SEO 최적화하여 블로그 포스트(배경 및 필요성, 기존 유사 서비스와 비교하여 특장점, 활용처, 가치, 기대효과, 결론을 포함)로 4000 토큰 이상 작성하라"],
                ["특허 출원에 활용할 기술 및 비즈니스모델 측면을 포함하여 특허 출원서 구성에 맞게 혁신적인 창의 발명 내용을 중심으로 4000 토큰 이상 작성하라."],
                ["계속 이어서 답변하라"],
            ],
            theme="default",  # 원하는 테마로 변경 가능
        )

        with gr.Accordion("시스템 프롬프트 및 옵션 설정", open=False):
            system_message = gr.Textbox(label="System Message", value="")
            max_tokens = gr.Slider(minimum=1, maximum=8000, value=4000, label="Max Tokens")
            temperature = gr.Slider(minimum=0, maximum=1, value=0.7, label="Temperature")
            top_p = gr.Slider(minimum=0, maximum=1, value=0.9, label="Top P")

    with gr.Tab("데이터 변환"):
        gr.Markdown("### CSV 파일 업로드 및 Parquet 변환")
        with gr.Row():
            with gr.Column():
                csv_file = gr.File(label="CSV 파일 업로드", type="file")
                upload_button = gr.Button("업로드 및 변환")
                upload_status = gr.Textbox(label="업로드 상태", interactive=False)
                parquet_preview = gr.Markdown(label="Parquet 파일 미리보기")
                download_button = gr.File(label="Parquet 파일 다운로드", file=None, interactive=False)

                # 업로드 버튼 클릭 시 실행할 함수
                def handle_csv_upload(file):
                    message, parquet_filename = upload_csv(file.name)
                    if parquet_filename:
                        # 파일을 다운로드할 수 있도록 경로 설정
                        with open(parquet_filename, "rb") as f:
                            data = f.read()
                        return message, parquet_preview.update(value=load_parquet(parquet_filename)), gr.File.update(value=(parquet_filename, data))
                    else:
                        return message, "", None

                upload_button.click(
                    handle_csv_upload,
                    inputs=csv_file,
                    outputs=[upload_status, parquet_preview, download_button]
                )
        
        gr.Markdown("### 기존 Parquet 파일")
        gr.Markdown(f"**test.parquet 파일 내용:**\n```markdown\n{test_parquet_content}\n```")

    with gr.Tab("챗봇"):
        gr.Markdown("### Parquet 파일 업로드 및 질문하기")
        with gr.Row():
            with gr.Column():
                parquet_upload = gr.File(label="Parquet 파일 업로드", type="file")
                parquet_upload_button = gr.Button("업로드")
                parquet_upload_status = gr.Textbox(label="업로드 상태", interactive=False)
                parquet_preview_chat = gr.Markdown(label="Parquet 파일 미리보기")
                # 상태를 저장할 Hidden State
                parquet_data_state = gr.State()

                def handle_parquet_upload(file):
                    message, parquet_content, parquet_json = upload_parquet(file.name)
                    if parquet_json:
                        return message, parquet_preview_chat.update(value=parquet_content), parquet_data_state.update(value=parquet_json)
                    else:
                        return message, gr.Markdown.update(value=""), parquet_data_state.update(value=None)

                parquet_upload_button.click(
                    handle_parquet_upload,
                    inputs=parquet_upload,
                    outputs=[parquet_upload_status, parquet_preview_chat, parquet_data_state]
                )

        gr.Markdown("### LLM과 대화하기")
        chat_interface = gr.ChatInterface(
            fn=respond,
            examples=[
                ["패션 코드 실행"],
                ["UHD 이미지 코드 실행"],
                ["MixGEN 코드 실행"],
                ["test.parquet 실행"],
                ["상세한 사용 방법을 마치 화면을 보면서 설명하듯이 4000 토큰 이상 자세히 설명하라"],
                ["FAQ 20건을 상세하게 작성하라. 4000토큰 이상 사용하라."],
                ["사용 방법과 차별점, 특징, 강점을 중심으로 4000 토큰 이상 유튜브 영상 스크립트 형태로 작성하라"],
                ["본 서비스를 SEO 최적화하여 블로그 포스트(배경 및 필요성, 기존 유사 서비스와 비교하여 특장점, 활용처, 가치, 기대효과, 결론을 포함)로 4000 토큰 이상 작성하라"],
                ["특허 출원에 활용할 기술 및 비즈니스모델 측면을 포함하여 특허 출원서 구성에 맞게 혁신적인 창의 발명 내용을 중심으로 4000 토큰 이상 작성하라."],
                ["계속 이어서 답변하라"],
            ],
            theme="default",  # 원하는 테마로 변경 가능
        )

    gr.Markdown("## 주의 사항")
    gr.Markdown("""
    - **CSV 업로드**: CSV 파일을 업로드하면 자동으로 Parquet 파일로 변환됩니다. CSV 파일은 반드시 **콤마(`,`)**로 구분되어야 합니다.
    - **Parquet 미리보기**: 업로드된 Parquet 파일의 첫 10개 행이 미리보기로 표시됩니다.
    - **LLM과의 대화**: 변환된 Parquet 파일 내용을 기반으로 LLM이 응답을 생성합니다.
    - **Parquet 다운로드**: 변환된 Parquet 파일을 다운로드하려면 변환된 파일 옆의 다운로드 링크를 클릭하세요.
    - **챗봇 Parquet 업로드**: 챗봇 탭에서 Parquet 파일을 업로드하면 해당 데이터를 기반으로 질문과 답변을 진행할 수 있습니다.
    """)

    gr.Markdown("### Gradio 인터페이스를 사용하여 LLM 모델과 상호작용하세요!")

if __name__ == "__main__":
    demo.launch()