authoring-app / pattern_en_plus.py
FerdinandPyCode's picture
first commit
55f834a
raw
history blame
4.88 kB
from langchain.prompts import PromptTemplate
from langchain.output_parsers import PydanticOutputParser
from pydantic import BaseModel, Field
from typing import List
import json
from langchain.chat_models import ChatOpenAI
# Modèle de sortie pour la détection de l'expression "en plus" en début de phrase
class ReformulationDetail(BaseModel):
original: str = Field(..., description="Phrase originale contenant 'en plus' en début de phrase.")
explanation: str = Field(..., description="Explication sur pourquoi l'expression 'en plus' est mal placée en début de phrase.")
reformulation_1: str = Field(..., description="Reformulation de la phrase avec 'en plus' déplacé.")
reformulation_2: str = Field(..., description="Seconde reformulation de la phrase.")
reformulation_3: str = Field(..., description="Troisième reformulation de la phrase.")
def to_dict(self):
return {
"original": self.original,
"explanation": self.explanation,
"reformulation_1": self.reformulation_1,
"reformulation_2": self.reformulation_2,
"reformulation_3": self.reformulation_3
}
class Summary(BaseModel):
total_occurrences: int = Field(..., description="Nombre total d'occurrences de 'en plus' détectées.")
reformulations_provided: int = Field(..., description="Nombre de reformulations fournies.")
def to_dict(self):
return {
"total_occurrences": self.total_occurrences,
"reformulations_provided": self.reformulations_provided
}
class DetectionResult(BaseModel):
reformulations: List[ReformulationDetail] = Field(..., description="Liste des reformulations proposées.")
summary: Summary = Field(..., description="Résumé de la détection.")
def to_dict(self):
return {
"reformulations": [reformulation.to_dict() for reformulation in self.reformulations],
"summary": self.summary.to_dict()
}
# Création du template pour la détection de l'utilisation de "en plus" en début de phrase
def en_plus_prompt_template():
return """
Vous êtes un éditeur de texte IA extrêmement rigoureux. Votre tâche est d'analyser **précisément** le texte fourni pour détecter **toutes les occurrences** de l'expression **"en plus"** utilisée **en début de phrase**, sans "de".
Pour chaque phrase trouvée, vous devez impérativement :
1. **Citer exactement** la phrase originale contenant "en plus".
2. **Expliquer brièvement et clairement** pourquoi "en plus" est mal placé en début de phrase et préciser qu'il doit être reformulé au cœur de la phrase.
3. **Proposer trois alternatives plus correctes**, telles que "de plus", "en outre", "par ailleurs", "aussi", mais **placées au milieu de la phrase**.
4. **Assurer** que chaque reformulation est **fluide**, **naturelle** et que l'alternative n'est pas placée au début ou à la fin de la phrase.
**Consignes supplémentaires :**
- **Ne pas ajouter** d'informations ou de commentaires non demandés.
- Présenter les résultats de manière **claire**, **structurée** et en respectant le format indiqué.
- **Ne pas analyser** ou modifier d'autres parties du texte que les phrases contenant "en plus" en début de phrase.
### Format attendu pour chaque occurrence :
- **Original** : "[Phrase originale]"
- **Explication** : "[Explication concise]"
- **Reformulation 1** : "[Reformulation ici]"
- **Reformulation 2** : "[Reformulation ici]"
- **Reformulation 3** : "[Reformulation ici]"
Le texte à analyser est le suivant :
```{text}```
{format_instruction}
"""
def detect_en_plus(text):
# Création du modèle de sortie avec Pydantic
output_parser = PydanticOutputParser(pydantic_object=DetectionResult)
# Génération du prompt à partir du modèle
gen_prompt_template = PromptTemplate(
input_variables=["text"],
template=en_plus_prompt_template(),
partial_variables={'format_instruction': output_parser.get_format_instructions()}
)
# Création du modèle de langage (avec LLM)
llm = ChatOpenAI(model='gpt-4', temperature=0.5, api_key="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")
# Chaîne de traitement du prompt avec le modèle et le parseur
llm_chain = gen_prompt_template | llm | output_parser
# Appel du modèle avec le texte fourni
result_dict = llm_chain.invoke({"text": text}).to_dict()
# Conversion du résultat en JSON
json_result = json.dumps(result_dict, indent=8, ensure_ascii=False)
# Génération du prompt final
final_prompt = gen_prompt_template.format(text=text)
# Retour des résultats
return {
"result": json_result,
"prompt": final_prompt
}