from langchain.prompts import PromptTemplate from langchain.output_parsers import PydanticOutputParser from pydantic import BaseModel, Field from typing import List, Tuple import json from langchain.chat_models import ChatOpenAI # Modèle de sortie pour la détection des expressions "VOICI" et "DÉCOUVREZ" class ReformulationDetail(BaseModel): original: str = Field(..., description="Phrase originale contenant 'VOICI' ou 'DÉCOUVREZ'.") explanation: str = Field(..., description="Explication sur pourquoi l'expression alourdit la phrase.") reformulation_1: str = Field(..., description="Reformulation basée sur l'approche Anticipation/Intrigue.") reformulation_2: str = Field(..., description="Reformulation basée sur l'approche Conversationnel.") reformulation_3: str = Field(..., description="Reformulation basée sur l'approche Accompagnement doux.") def to_dict(self): return { "original": self.original, "explanation": self.explanation, "reformulation_1": self.reformulation_1, "reformulation_2": self.reformulation_2, "reformulation_3": self.reformulation_3, } class Summary(BaseModel): total_occurrences: int = Field(..., description="Nombre total d'occurrences de 'VOICI' et 'DÉCOUVREZ'.") reformulations_provided: int = Field(..., description="Nombre de reformulations proposées.") def to_dict(self): return { "total_occurrences": self.total_occurrences, "reformulations_provided": self.reformulations_provided, } class DetectionResult(BaseModel): reformulations: List[ReformulationDetail] = Field(..., description="Liste des reformulations proposées pour chaque occurrence.") summary: Summary = Field(..., description="Résumé de la détection.") def to_dict(self): return { "reformulations": [reformulation.to_dict() for reformulation in self.reformulations], "summary": self.summary.to_dict() } # Création du template pour la détection de l'utilisation de "VOICI" et "DÉCOUVREZ" à la fin d'une introduction def voici_decouvrez_prompt_template(): return """ Tu es un éditeur de texte IA extrêmement performant et rigoureux. Ta tâche est d'analyser **précisément** le texte fourni pour détecter **toutes les occurrences** des expressions **"VOICI"** et **"DÉCOUVREZ"** situées **à la fin d'une introduction**. L'introduction , c'est le premier paragraphe. Pour chaque occurrence identifiée, tu dois obligatoirement : 1. **Citer exactement** la phrase originale contenant "VOICI" ou "DÉCOUVREZ". 2. **Expliquer brièvement et clairement** pourquoi l'utilisation de ce terme peut alourdir ou rendre la transition vers le contenu moins fluide. 3. **Proposer trois reformulations distinctes**, selon les approches suivantes : - **Anticipation/Intrigue** : Créer de l'attente ou de l'intrigue pour susciter l'intérêt du lecteur. - **Conversationnel** : Formuler la phrase de manière plus engageante et naturelle. - **Accompagnement doux** : Offrir une transition progressive et moins directive vers le contenu. ### Format attendu pour chaque occurrence : - **Original** : "[Phrase originale]" - **Explication** : "[Explication concise]" - **Reformulation 1 (Anticipation/Intrigue)** : "[Reformulation ici]" - **Reformulation 2 (Conversationnel)** : "[Reformulation ici]" - **Reformulation 3 (Accompagnement doux)** : "[Reformulation ici]" Le texte à analyser est le suivant : ```{text}``` Le format de la sortie doit être en JSON. ```{format_instruction}``` """ def detect_voici_decouvrez(text): # Création du modèle de sortie avec Pydantic output_parser = PydanticOutputParser(pydantic_object=DetectionResult) # Génération du prompt à partir du modèle gen_prompt_template = PromptTemplate( input_variables=["text"], template=voici_decouvrez_prompt_template(), partial_variables={'format_instruction': output_parser.get_format_instructions()} ) # Création du modèle de langage (avec LLM) llm = ChatOpenAI(model='gpt-4', temperature=0.5, api_key="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") # Chaîne de traitement du prompt avec le modèle et le parseur llm_chain = gen_prompt_template | llm | output_parser # Appel du modèle avec le texte fourni result_dict = llm_chain.invoke({"text": text}).to_dict() # Conversion du résultat en JSON json_result = json.dumps(result_dict, indent=8, ensure_ascii=False) # Génération du prompt final final_prompt = gen_prompt_template.format(text=text) # Retour des résultats return { "result": json_result, "prompt": final_prompt }