Spaces:

Ouebx-Team
/

authoring-app

Sleeping

App Files Files Community

FerdinandPyCode commited on Oct 1, 2024

Commit

68e87d0

1 Parent(s): 50819a8

ce qui explique V2

Browse files

Files changed (3) hide show

app.py +2 -2
pattern_ce_qui_explique.py +99 -74
pattern_est_une_etape.py +0 -3

app.py CHANGED Viewed

@@ -31,7 +31,7 @@ st.title("Analyse du texte")
 List_prompt = {
     "V2 < Détection du pattern 'est une étape' >": est_une_etape_prompt_template(),
     "< Détection du pattern 'epoque de, à l'ère de' >": epoque_prompt_template(),
-    "< Détection du pattern 'ce qui explique' >": explication_prompt_template(),
     "< Détection des adverbes en -ment >": adverbement_prompt_template(),
     "< Détection des connecteurs 'cependant' >": connecteur_prompt_template(),
     "< Détection des decision 'éclairée...' >": decision_prompt_template(),
@@ -101,7 +101,7 @@ if st.button("Lancer l'analyse"):
                 logging.error(f"Error during analysis: {e}")
                 st.error(f"Une erreur s'est produite lors de l'analyse : {str(e)}")
-        elif option == "< Détection du pattern 'ce qui explique' >":
             try:
                 # Analyser le texte pour les fautes de style
                 result = explication(input_text)

 List_prompt = {
     "V2 < Détection du pattern 'est une étape' >": est_une_etape_prompt_template(),
     "< Détection du pattern 'epoque de, à l'ère de' >": epoque_prompt_template(),
+    "<V2 Détection du pattern 'ce qui explique' >": explication_prompt_template(),
     "< Détection des adverbes en -ment >": adverbement_prompt_template(),
     "< Détection des connecteurs 'cependant' >": connecteur_prompt_template(),
     "< Détection des decision 'éclairée...' >": decision_prompt_template(),
                 logging.error(f"Error during analysis: {e}")
                 st.error(f"Une erreur s'est produite lors de l'analyse : {str(e)}")
+        elif option == "<V2 Détection du pattern 'ce qui explique' >":
             try:
                 # Analyser le texte pour les fautes de style
                 result = explication(input_text)

pattern_ce_qui_explique.py CHANGED Viewed

@@ -7,94 +7,119 @@ from langchain.chat_models import ChatOpenAI
 from langchain.output_parsers import PydanticOutputParser
-# Modèles Pydantic pour structurer la réponse
-class AlternativeSuggestion(BaseModel):
-    suggestion_1: str = Field(..., description="Première suggestion de reformulation.")
-    suggestion_2: str = Field(..., description="Deuxième suggestion de reformulation.")
-class PatternDetail(BaseModel):
-    pattern: str = Field(..., description="Mot ou expression détectée.")
-    indices: List[Tuple[int, int]] = Field(..., description="Indices de début et de fin pour chaque occurrence dans le texte.")
-    sentence: str = Field(..., description="Phrase complète où l'expression apparaît.")
-    alternative_suggestions: AlternativeSuggestion = Field(..., description="Deux suggestions de reformulation.")
-    def to_dict(self):
-        return {
-            "pattern": self.pattern,
-            "indices": self.indices,
-            "sentence": self.sentence,
-            "alternative_suggestions": {
-                "suggestion_1": self.alternative_suggestions.suggestion_1,
-                "suggestion_2": self.alternative_suggestions.suggestion_2,
-            }
-        }
 class Summary(BaseModel):
-    total_patterns_detected: int = Field(..., description="Nombre total de patterns détectés.")
-    alternative_suggestions_provided: int = Field(..., description="Nombre total de suggestions fournies.")
-    occurrences: int = Field(..., description="Nombre total d'occurrences trouvées dans le texte.")
-    def to_dict(self):
-        return {
-            "total_patterns_detected": self.total_patterns_detected,
-            "alternative_suggestions_provided": self.alternative_suggestions_provided,
-            "occurrences": self.occurrences
-        }
 class DetectionResult(BaseModel):
-    patterns: List[PatternDetail] = Field(..., description="Liste des patterns détectés avec détails.")
-    summary: Summary = Field(..., description="Résumé de la détection.")
     def to_dict(self):
         return {
-            "patterns": [pattern.to_dict() for pattern in self.patterns],
-            "summary": self.summary.to_dict()
         }
 def explication_prompt_template():
-    return """
-    Analyse le texte suivant et identifie toutes les occurrences de l'expression "Ce qui" et ses variantes, telles que :
-    "Ce qui signifie que", "Ce qui implique que", "Ce qui veut dire que", "Ce qui fait que", "Ce qui entraîne",
-    "Ce qui conduit à", "Ce qui permet de", "Ce qui résulte en", "Ce qui cause", "Ce qui représente".
-    Incluez également toute autre expression similaire commençant par "Ce qui" et introduisant une conséquence, une explication ou une clarification.
-    Pour chaque occurrence trouvée, veuillez :
-    - Citer la phrase complète où l'expression apparaît.
-    - Indiquer l'expression exacte utilisée dans le texte.
-    - Proposer deux reformulations de la phrase pour changer l'expression détectée, en évitant les répétitions, et rendre la phrase plus précise et claire.
-    - Assurez-vous de respecter les règles suivantes :
-      1. Ne pas utiliser plus d'une fois dans l'introduction des expressions comme "crucial", "essentiel", "important", "fondamental", etc.
-      2. Ne pas utiliser "il existe", "il faut", "cependant", "de plus", etc., en début de phrase.
-      3. Les expressions comme "Joue un rôle", "il est", ou "est une étape" ne doivent pas être associées à des mots comme "important", "essentiel", etc.
-      4. "En plus" ne doit pas être seul en début de phrase.
-    Le format de sortie doit être un JSON structuré avec les éléments suivants pour chaque pattern détecté :
-    - "pattern": "mot ou expression détectée",
-    - "indices": [[index de début, index de fin pour chaque occurrence]],
-    - "sentence": "phrase où l'expression est utilisée",
-    - "alternative_suggestions": ["suggestion 1", "suggestion 2"]
-    Si aucun pattern n'est trouvé, retournez un JSON avec :
-    - "pattern0": "",
-    - "occurrences": 0,
-    À la fin, ajoutez un résumé avec :
-    - "total_patterns_detected": nombre total de patterns détectés,
-    - "alternative_suggestions_provided": nombre de suggestions fournies,
-    - "occurrences": nombre d'occurrences.
-    Voici le texte à analyser :
-    ```{text}```
-    \n{format_instruction}
     """

 from langchain.output_parsers import PydanticOutputParser
+class Expression(BaseModel):
+    expression: str = Field(..., description="Expression détectée (ex: 'est une étape importante')")
+    indice_debut: int = Field(..., description="Indice de début de l'expression")
+    indice_fin: int = Field(..., description="Indice de fin de l'expression")
+class Phrase(BaseModel):
+    texte: str = Field(..., description="Phrase complète contenant l'expression ou les expressions détectées")
+    indice_debut: int = Field(..., description="Indice de début de la phrase")
+    indice_fin: int = Field(..., description="Indice de fin de la phrase")
+class Reformulation(BaseModel):
+    texte: str = Field(..., description="Texte de la reformulation")
+class PhraseDetectee(BaseModel):
+    phrase: Phrase = Field(..., description="Détails de la phrase")
+    erreurs: List[Expression] = Field(..., description="Liste des expressions détectées dans la phrase")
+    reformulations: List[Reformulation] = Field(..., description="Liste des reformulations proposées")
+    justification: str = Field(..., description="Justification des reformulations proposées")
 class Summary(BaseModel):
+    total_erreurs: int = Field(..., description="Nombre total d'expressions détectées")
+    total_phrases: int = Field(..., description="Nombre total de phrases contenant des expressions")
+    total_reformulations: int = Field(..., description="Nombre total de reformulations proposées")
 class DetectionResult(BaseModel):
+    phrases_detectees: List[PhraseDetectee] = Field(..., description="Liste des phrases détectées avec détails")
+    summary: Summary = Field(..., description="Résumé de la détection")
     def to_dict(self):
         return {
+            "phrases_detectees": [phrase.model_dump() for phrase in self.phrases_detectees],
+            "summary": self.summary.model_dump()
         }
 def explication_prompt_template():
+    return """En tant que rédacteur web expert, votre mission est d'analyser le texte suivant et d'identifier toutes les occurrences de l'expression "Ce qui" et ses variantes, particulièrement lorsqu'elles introduisent une conséquence, une explication ou une clarification.
+    Expressions à rechercher (incluez également toute autre expression similaire commençant par "Ce qui") :
+    - "Ce qui signifie que"
+    - "Ce qui implique que"
+    - "Ce qui veut dire que"
+    - "Ce qui fait que"
+    - "Ce qui entraîne"
+    - "Ce qui conduit à"
+    - "Ce qui permet de"
+    - "Ce qui résulte en"
+    - "Ce qui cause"
+    - "Ce qui représente"
+    Voici quelques exemples d'erreurs que vous devez détecter et corriger :
+    - "Ce qui signifie que le projet est en retard", mais on dit "Le projet accuse donc un retard"
+    - "Ce qui implique que nous devons revoir notre stratégie", mais on dit "Par conséquent, notre stratégie nécessite une révision"
+    - "Ce qui veut dire que les résultats sont positifs", mais on dit "Les résultats s'avèrent donc positifs"
+    - "Ce qui fait que nous devons agir rapidement", mais on dit "Cette situation exige une action rapide de notre part"
+    - "Ce qui entraîne une augmentation des coûts", mais on dit "Cela entraîne une hausse des coûts"
+    - "Ce qui conduit à une meilleure productivité", mais on dit "Ainsi, la productivité s'améliore"
+    - "Ce qui permet de réduire les erreurs", mais on dit "Cela permet une réduction des erreurs"
+    - "Ce qui résulte en une amélioration de la qualité", mais on dit "Il en résulte une amélioration de la qualité"
+    - "Ce qui cause des problèmes de communication", mais on dit "Cela engendre des problèmes de communication"
+    - "Ce qui représente un défi majeur pour l'équipe", mais on dit "L'équipe fait face à un défi majeur"
+    Regroupe les expressions détectés par phrase et pour chaque phrase, veuillez :
+    1. Citez la phrase complète avec ses indices de début et de fin.
+    2. Identifiez l'expression ou les expressions exacte avec leurs indices.
+    3. Proposer 5 reformulations améliorant le style tout en préservant le sens et le contexte.
+    4. Fournir une justification unique pour les reformulations, expliquant comment elles améliorent le style ou la clarté.
+    Règles de reformulation :
+    - Évitez l'utilisation directe des expressions commençant par "Ce qui".
+    - Remplacez ces constructions par des formulations plus directes ou des liens logiques plus explicites.
+    - Utilisez un vocabulaire professionnel et formel.
+    - Variez la structure des phrases pour éviter la répétition.
+    - Assurez-vous que les reformulations conservent le lien logique ou la clarification exprimée dans la phrase originale.
+    Texte à analyser :
+    {text}
+    Format de sortie JSON :
+    {{
+      "phrases_detectees": [
+        {{
+          "phrase": {{
+            "texte": "Phrase complète contenant l'expression ou les expressions détectées",
+            "indice_debut": x,
+            "indice_fin": y
+          }},
+          "erreurs": [
+            {{
+              "expression": "Expression détectée (ex: 'Ce qui signifie que')",
+              "indice_debut": a,
+              "indice_fin": b
+            }}
+          ],
+          "reformulations": [
+            {{ "texte": "Reformulation 1" }},
+            {{ "texte": "Reformulation 2" }},
+            {{ "texte": "Reformulation 3" }},
+            {{ "texte": "Reformulation 4" }},
+            {{ "texte": "Reformulation 5" }}
+          ],
+          "justification": "Justification des reformulations proposées, expliquant comment elles améliorent le style ou la clarté."
+        }}
+      ],
+      "summary": {{
+        "total_erreurs": nombre_total_d_expressions_detectées,
+        "total_phrases": nombre_total_de_phrases_contenant_des_expressions,
+        "total_reformulations": nombre_total_de_reformulations_proposées
+      }}
+    }}
+    Assurez-vous que les indices correspondent aux positions exactes dans le texte original et que le JSON est correctement formaté.
+    {format_instruction}
     """

pattern_est_une_etape.py CHANGED Viewed

@@ -7,9 +7,6 @@ from langchain.chat_models import ChatOpenAI
 from langchain.output_parsers import PydanticOutputParser
-from pydantic import BaseModel, Field
-from typing import List, Tuple
 class Expression(BaseModel):
     expression: str = Field(..., description="Expression détectée (ex: 'est une étape importante')")
     indice_debut: int = Field(..., description="Indice de début de l'expression")

 from langchain.output_parsers import PydanticOutputParser
 class Expression(BaseModel):
     expression: str = Field(..., description="Expression détectée (ex: 'est une étape importante')")
     indice_debut: int = Field(..., description="Indice de début de l'expression")