Spaces:

Ouebx-Team
/

authoring-app

Sleeping

App Files Files Community

authoring-app / pattern_detection_permettre.py

FerdinandPyCode

first commit

55f834a 6 months ago

raw

history blame contribute delete

2.15 kB

	import spacy

	# Charger le modèle de langue française
	nlp = spacy.load('fr_core_news_md') # Utilisez 'fr_core_news_sm' si 'md' n'est pas disponible

	def est_auxiliaire(token):
	return token.pos_ == "AUX" or (token.pos_ == "VERB" and token.tag_ and "Aux" in token.tag_)

	def est_infinitif(token):
	return token.pos_ == "VERB" and "Inf" in token.tag_

	def trouver_formes_permettre(texte):
	doc = nlp(texte)
	resultats = []
	for i, token in enumerate(doc):
	# Vérifier si le lemme est "permettre" et que le mot est un verbe (autre que "permis")
	if token.lemma_ == "permettre" and token.pos_ == "VERB" and token.text.lower() != "permis":
	resultats.append((token.text, token.idx))
	# Traiter spécifiquement le mot "permis"
	elif token.text.lower() == "permis":
	est_verbe = False
	# Vérifier si le mot précédent est un auxiliaire
	if i > 0 and est_auxiliaire(doc[i - 1]):
	est_verbe = True
	# Vérifier si le mot suivant est "de" suivi d'un verbe à l'infinitif
	elif i + 2 < len(doc) and doc[i + 1].text.lower() == "de" and est_infinitif(doc[i + 2]):
	est_verbe = True
	# Vérifier si le mot précédent est un déterminant (le, la, un, une, etc.)
	elif i > 0 and doc[i - 1].pos_ == "DET":
	est_verbe = False
	else:
	# Autres vérifications possibles si nécessaire
	est_verbe = False

	if est_verbe:
	resultats.append((token.text, token.idx))
	else:
	continue # C'est un nom, on l'exclut
	return resultats

	# Exemple d'utilisation
	texte = """
	Il m'a permis de partir. J'ai besoin d'un permis de conduire.
	Cela permet de comprendre. La loi permettra des changements.
	Le permis de construire a été accordé. Nous avons permis cette action.
	"""

	formes_permettre = trouver_formes_permettre(texte)
	print("Les formes du verbe 'permettre' trouvées dans le texte avec leurs index sont :")
	for mot, index in formes_permettre:
	print(f"Mot : '{mot}' à l'index {index}")