Spaces:

fruitpicker01
/

Test_Pipeline_v10

Sleeping

App Files Files Community

Test_Pipeline_v10 / app.py

fruitpicker01

Update app.py

891644e verified 4 months ago

raw

history blame

26.1 kB

	import gradio as gr
	import pandas as pd
	import os
	import random
	import re
	import pymorphy3
	from openai import OpenAI

	XAI_API_KEY = os.getenv("XAI_API_KEY")
	client = OpenAI(
	api_key=XAI_API_KEY,
	base_url="https://api.x.ai/v1",
	)

	def load_dropdown_data(file_path, sheet_name, column_name):
	data = pd.read_excel(file_path, sheet_name=sheet_name)
	return data[column_name].dropna().unique().tolist()

	file_path = "Исходные данные.xlsx"

	products_list, data_products = load_dropdown_data(file_path, "Продукты", "Наименование продукта"), pd.read_excel(file_path, sheet_name="Продукты")
	# Добавляем "Свой продукт" в начало списка
	products = ["Свой продукт"] + list(products_list)

	genders_data = pd.read_excel(file_path, sheet_name="Пол")
	generations_data = pd.read_excel(file_path, sheet_name="Поколение")
	psychotypes_data = pd.read_excel(file_path, sheet_name="Психотип")
	business_stages_data = pd.read_excel(file_path, sheet_name="Стадия бизнеса")
	industries_data = pd.read_excel(file_path, sheet_name="Отрасль")
	opfs_data = pd.read_excel(file_path, sheet_name="ОПФ")

	genders = genders_data["Пол"].dropna().unique().tolist()
	generations = generations_data["Поколение"].dropna().unique().tolist()
	psychotypes = psychotypes_data["Психотип"].dropna().unique().tolist()
	business_stages = business_stages_data["Стадия бизнеса"].dropna().unique().tolist()
	industries = industries_data["Отрасль"].dropna().unique().tolist()
	opfs = opfs_data["ОПФ"].dropna().unique().tolist()

	approaches_data = pd.read_excel(file_path, sheet_name="Подход")

	approach_dict = {
	"Указание на пользу": {
	"prefix": "Начни SMS с указания на пользу продукта. Используй глагол в побудительном наклонении. Не начинай с вопроса",
	"suffix": "Убедись, что SMS начинается с указания на пользу продукта и использования глагола в побудительном наклонении и не начинается с вопроса"
	},
	"Вопрос": {
	"prefix": "Начни сообщение с вопроса, который указывает на пользу продукта для клиента",
	"suffix": "Убедись, что готовый текст начинается с вопроса, который указывает на пользу продукта для клиента"
	},
	"Призыв к действию": {
	"prefix": "Начни SMS с призыва к действию с продуктом. Не начинай с вопроса",
	"suffix": "Убедись, что готовый текст начинается с призыва к действию с продуктом и не начинается с вопроса"
	}
	}

	def fill_product_details(selected_product, data):
	# Если выбран "Свой продукт", поля очищаем и даём редактировать
	if selected_product == "Свой продукт":
	return gr.update(value="", interactive=True), \
	gr.update(value="", interactive=True), \
	gr.update(value="", interactive=True), \
	gr.update(value="", interactive=True)
	else:
	# Иначе заполняем из файла и делаем поля неактивными
	if selected_product and selected_product in data["Наименование продукта"].values:
	product_row = data[data["Наименование продукта"] == selected_product].iloc[0]
	return (gr.update(value=product_row.get("Описание предложения", ""), interactive=False),
	gr.update(value=product_row.get("Наименование продукта", ""), interactive=False),
	gr.update(value=product_row.get("Преимущества", ""), interactive=False),
	gr.update(value=product_row.get("Ключевое сообщение", ""), interactive=False))
	else:
	return gr.update(value="", interactive=False), \
	gr.update(value="", interactive=False), \
	gr.update(value="", interactive=False), \
	gr.update(value="", interactive=False)

	def get_approaches(gender, generation, psychotype, approaches_df):
	if approaches_df is None or approaches_df.empty:
	return "Подход не найден для выбранных параметров."

	filters = []
	for param_name, param_value in [('Пол', gender), ('Поколение', generation), ('Психотип', psychotype)]:
	if not param_value or param_value == "Не выбрано":
	filters.append(approaches_df[param_name].isnull() \| (approaches_df[param_name].fillna('') == ''))
	else:
	filters.append(approaches_df[param_name].fillna('') == param_value)

	combined_filter = filters[0]
	for f in filters[1:]:
	combined_filter &= f

	matching_rows = approaches_df[combined_filter]
	if matching_rows.empty:
	return "Подход не найден для выбранных параметров."

	approach_list = []
	for approaches in matching_rows['Подход']:
	approach_names = [a.strip() for a in str(approaches).split(',')]
	approach_list.extend(approach_names)

	approach_list = list(set(approach_list))
	return ', '.join(approach_list)

	def get_instructions_for_param(param_value, df, col):
	if not param_value or param_value == "Не выбрано":
	return None
	row = df[df[col] == param_value]
	if row.empty:
	return None
	instr1 = row.iloc[0].get("Инструкция 1", "")
	if not instr1.strip():
	return None
	return instr1

	def format_instruction_string(instr):
	terms = [t.strip() for t in instr.split(',') if t.strip()]
	return " или ".join(terms) if terms else ""

	def generate_display_prompts(description, product_name, benefits, key_message, chosen_approach,
	gender, generation, psychotype, business_stage, industry, opf):
	if chosen_approach == "Подход не найден для выбранных параметров.":
	return ("Для формирования промпта выберите хотя бы один личный персональный параметр для определения подхода",
	"Для формирования промпта выберите хотя бы один личный персональный параметр для определения подхода")

	approach_list = [a.strip() for a in chosen_approach.split(',') if a.strip()]
	prefix_parts = []
	suffix_parts = []
	for a in approach_list:
	if a in approach_dict:
	prefix_parts.append(approach_dict[a]["prefix"])
	suffix_parts.append(approach_dict[a]["suffix"])

	if len(prefix_parts) > 1:
	approach_prefix = " / ".join(prefix_parts)
	approach_suffix = " / ".join(suffix_parts)
	else:
	approach_prefix = prefix_parts[0] if prefix_parts else ""
	approach_suffix = suffix_parts[0] if suffix_parts else ""

	instructions_data = [
	(gender, genders_data, "Пол"),
	(generation, generations_data, "Поколение"),
	(psychotype, psychotypes_data, "Психотип"),
	(business_stage, business_stages_data, "Стадия бизнеса"),
	(industry, industries_data, "Отрасль"),
	(opf, opfs_data, "ОПФ")
	]

	chosen_params_instructions = []
	for (param_value, df, col) in instructions_data:
	instr1 = get_instructions_for_param(param_value, df, col)
	if instr1:
	chosen_params_instructions.append(instr1)

	if not chosen_params_instructions:
	return ("Для формирования промпта выберите хотя бы один личный персональный параметр для определения подхода",
	"Для формирования промпта выберите хотя бы один личный персональный параметр для определения подхода")

	lines = []
	for i, instr_line in enumerate(chosen_params_instructions, start=1):
	formatted_line = format_instruction_string(instr_line)
	lines.append(f"{i}. {formatted_line}.")
	mandatory_terms = "\n".join(lines)

	prompt = f"""Напиши три или четыре предложения. {approach_prefix}.
	Напиши рекламное SMS для следующего продукта:
	«{description}».
	Не изменяй название продукта: «{product_name}».
	Преимущества:
	«{benefits}».
	ОБЯЗАТЕЛЬНО используй в SMS КАЖДЫЙ из следующих терминов:
	{mandatory_terms}
	Убедись, что написал не меньше трех и не больше четырех предложений.
	{approach_suffix}.
	Убедись, что УМЕСТНО использовал КАЖДЫЙ необходимый термин.
	Убедись, что в SMS без изменений, синонимов и перестановок слов используется наименование продукта: «{product_name}».
	Убедись, что в SMS есть следующая ключевая информация: «{key_message}»."""
	return prompt, prompt

	def generate_model_prompt(description, product_name, benefits, key_message,
	gender, generation, psychotype, business_stage, industry, opf,
	single_approach):
	prefix = approach_dict[single_approach]["prefix"]
	suffix = approach_dict[single_approach]["suffix"]

	instructions_data = [
	(gender, genders_data, "Пол"),
	(generation, generations_data, "Поколение"),
	(psychotype, psychotypes_data, "Психотип"),
	(business_stage, business_stages_data, "Стадия бизнеса"),
	(industry, industries_data, "Отрасль"),
	(opf, opfs_data, "ОПФ")
	]

	chosen_params_instructions = []
	for (param_value, df, col) in instructions_data:
	instr1 = get_instructions_for_param(param_value, df, col)
	if instr1:
	chosen_params_instructions.append(instr1)

	if chosen_params_instructions:
	lines = []
	for i, instr_line in enumerate(chosen_params_instructions, start=1):
	formatted_line = format_instruction_string(instr_line)
	lines.append(f"{i}. {formatted_line}.")
	mandatory_terms = "\n".join(lines)
	else:
	mandatory_terms = None

	if mandatory_terms:
	model_prompt = f"""Напиши три или четыре предложения. {prefix}.
	Напиши рекламное SMS для следующего продукта:
	«{description}».
	Не изменяй название продукта: «{product_name}».
	Преимущества:
	«{benefits}».
	ОБЯЗАТЕЛЬНО используй в SMS КАЖДЫЙ из следующих терминов:
	{mandatory_terms}
	Убедись, что написал не меньше трех и не больше четырех предложений.
	{suffix}.
	Убедись, что УМЕСТНО использовал КАЖДЫЙ необходимый термин.
	Убедись, что в SMS без изменений, синонимов и перестановок слов используется наименование продукта: «{product_name}».
	Убедись, что в SMS есть следующая ключевая информация: «{key_message}»."""
	else:
	model_prompt = ""

	return model_prompt

	def call_model(model_prompt):
	completion = client.chat.completions.create(
	model="grok-2-1212",
	messages=[
	{"role": "system", "content": "You are a world-class expert in creating personalized SMS who returns only the SMS and nothing else."},
	{"role": "user", "content": model_prompt},
	],
	)
	return completion.choices[0].message.content.strip()

	# Функция для корректировки
	def correct_dash_usage(text):
	morph = pymorphy3.MorphAnalyzer()
	text = re.sub(r'\s[-–—]\s', ' — ', text)
	text = re.sub(r'(?<=\d)[-–—](?=\d)', '–', text)
	text = re.sub(r'(?<=[a-zA-Zа-яА-Я0-9])[-–—](?=[a-zA-Zа-яА-Я0-9])', '-', text)
	text = re.sub(r'"([^\"]+)"', r'«\1»', text)
	if text.count('"') == 1:
	text = text.replace('"', '')
	if (text.startswith('"') and text.endswith('"')) or (text.startswith('«') and text.endswith('»')):
	text = text[1:-1].strip()
	text = re.sub(r'(\d+)[kкКK]', r'\1 000', text, flags=re.IGNORECASE)

	greeting_patterns = [
	r"привет\b", r"здравствуй", r"добрый\s(день\|вечер\|утро)",
	r"дорогой\b", r"уважаемый\b", r"дорогая\b", r"уважаемая\b",
	r"господин\b", r"госпожа\b", r"друг\b", r"коллега\b",
	r"товарищ\b", r"приятель\b", r"подруга\b"
	]
	def is_greeting_sentence(sentence):
	words = sentence.split()
	if len(words) < 5:
	for word in words:
	parsed = morph.parse(word.lower())[0]
	for pattern in greeting_patterns:
	if re.search(pattern, parsed.normal_form):
	return True
	return False

	sentences = re.split(r'(?<=[.!?])\s+', text)
	if sentences and is_greeting_sentence(sentences[0]):
	sentences = sentences[1:]
	text = ' '.join(sentences)

	def restore_yo(text):
	morph2 = pymorphy3.MorphAnalyzer()
	words = text.split()
	restored_words = []
	for word in words:
	if word.isupper():
	restored_words.append(word)
	continue
	if word.lower() == "все":
	restored_words.append(word)
	continue
	parsed = morph2.parse(word)[0]
	restored_word = parsed.word
	if word and word[0].isupper():
	restored_word = restored_word.capitalize()
	restored_words.append(restored_word)
	return ' '.join(restored_words)

	text = restore_yo(text)
	text = re.sub(r'\bИп\b', 'ИП', text, flags=re.IGNORECASE)
	text = re.sub(r'\bОоо\b', 'ООО', text, flags=re.IGNORECASE)
	text = re.sub(r'\bРф\b', 'РФ', text, flags=re.IGNORECASE)
	text = re.sub(r'\bпользовуйтесь\b', 'пользуйтесь', text, flags=re.IGNORECASE)
	text = re.sub(r'\bею\b', 'ей', text, flags=re.IGNORECASE)
	text = re.sub(r'\bповышьте\b', 'повысьте', text, flags=re.IGNORECASE)
	text = re.sub(r'\bСбербизнес(?:а\|е)?\b', 'СберБизнес', text, flags=re.IGNORECASE)
	text = re.sub(r'\bСбербанк\b', 'СберБанк', text, flags=re.IGNORECASE)
	text = re.sub(r'\bвашего ООО\b', 'вашей компании', text, flags=re.IGNORECASE)
	text = re.sub(r'\b0₽\b', '0 р', text, flags=re.IGNORECASE)
	text = re.sub(r'\b₽\b', 'р', text, flags=re.IGNORECASE)
	text = re.sub(r'\bруб\.(?=\W\|$)', 'р', text, flags=re.IGNORECASE)
	text = re.sub(r'\bруб(?:ля\|лей)\b', 'р', text, flags=re.IGNORECASE)
	text = re.sub(r'(\d+)\s+тысяч(?:а\|и)?(?:\s+рублей)?', r'\1 000 р', text, flags=re.IGNORECASE)
	text = re.sub(r'(\d+)\sтыс\.\sруб\.', r'\1 000 р', text, flags=re.IGNORECASE)
	text = re.sub(r'(\d+)\sтыс\.\sр\.?', r'\1 000 р', text, flags=re.IGNORECASE)
	text = re.sub(r'(\d+)\s+миллиона\b\|\bмиллионов\b', r'\1 млн', text, flags=re.IGNORECASE)
	text = re.sub(r'(\d+)\sмлн\sруб\.', r'\1 млн р', text, flags=re.IGNORECASE)
	text = re.sub(r'(\d+)\s*р\b', r'\1 р', text)

	def remove_specific_sentences(text):
	sents = re.split(r'(?<=[.!?])\s+', text)
	filtered = [s for s in sents if not re.search(r'\bникаких\s+(посещений\|визитов)\b', s, re.IGNORECASE)]
	return ' '.join(filtered)

	text = re.sub(r'\b(\d+)\s+000\s+000\s*р\b', r'\1 млн р', text, flags=re.IGNORECASE)
	text = re.sub(r' р р ', r' р ', text, flags=re.IGNORECASE)
	text = remove_specific_sentences(text)
	return text

	def clean_message(message):
	if not message.endswith(('.', '!', '?')):
	last_period = max(message.rfind('.'), message.rfind('!'), message.rfind('?'))
	if last_period != -1:
	message = message[:last_period + 1]
	return message

	def generate_message_with_retry(model_prompt):
	# До 10 попыток, чтобы длина была от 160 до 250 символов
	last_message = ""
	for _ in range(10):
	msg = call_model(model_prompt)
	msg = correct_dash_usage(msg)
	msg = clean_message(msg)
	length = len(msg)
	if 160 <= length <= 250:
	# Добавляем информацию о количестве знаков
	msg += f"\n\n------\nКоличество знаков: {length}"
	return msg
	last_message = msg
	# Если не удалось подобрать длину
	length = len(last_message)
	last_message += f"\n\n------\nКоличество знаков: {length}"
	return last_message

	def update_prompts_on_params_change(description, product_name, benefits, key_message,
	gender, generation, psychotype, business_stage, industry, opf):
	chosen_approach = get_approaches(gender, generation, psychotype, approaches_data)
	prompt_1, prompt_2 = generate_display_prompts(description, product_name, benefits, key_message,
	chosen_approach, gender, generation, psychotype,
	business_stage, industry, opf)
	return chosen_approach, prompt_1, prompt_2

	def generate_personalized_sms(description, product_name, benefits, key_message,
	gender, generation, psychotype, business_stage, industry, opf,
	chosen_approach, prompt_1, prompt_2):
	# Если нет персональных параметров или подхода
	if "Для формирования промпта выберите хотя бы один личный персональный параметр" in prompt_1 or chosen_approach == "Подход не найден для выбранных параметров.":
	gr.Warning("Задайте хотя бы один личный персональный параметр для определения подхода, чтобы был сформирован промпт")
	return "", ""

	approach_list = [a.strip() for a in chosen_approach.split(',') if a.strip()]
	if not approach_list:
	gr.Warning("Задайте хотя бы один личный персональный параметр для определения подхода, чтобы был сформирован промпт")
	return "", ""

	chosen_single_approach_1 = random.choice(approach_list) if len(approach_list) > 1 else approach_list[0]
	chosen_single_approach_2 = random.choice(approach_list) if len(approach_list) > 1 else approach_list[0]

	model_prompt_1 = generate_model_prompt(description, product_name, benefits, key_message,
	gender, generation, psychotype, business_stage, industry, opf,
	chosen_single_approach_1)
	model_prompt_2 = generate_model_prompt(description, product_name, benefits, key_message,
	gender, generation, psychotype, business_stage, industry, opf,
	chosen_single_approach_2)

	sms_1 = generate_message_with_retry(model_prompt_1)
	sms_2 = generate_message_with_retry(model_prompt_2)

	return sms_1, sms_2

	with gr.Blocks(theme="default") as demo:
	gr.Markdown("Процент созданных SMS по выбранному продукту")
	progress_bar_html = """
	<div style="width: 100%; background-color: #e0e0e0; border-radius: 10px; overflow: hidden;">
	<div style="width: 0%; background-color: #4caf50; height: 20px; text-align: center; color: white;">
	0%
	</div>
	</div>
	"""
	gr.HTML(progress_bar_html)

	with gr.Row():
	with gr.Column(scale=1):
	gr.Markdown("Продукт")
	product_dropdown = gr.Dropdown(label="Продукт", choices=products, value=products[0])
	description = gr.Textbox(label="Описание предложения", lines=5, value="", interactive=True)
	product_name = gr.Textbox(label="Наименование продукта", lines=1, value="", interactive=True)
	benefits = gr.Textbox(label="Преимущества", lines=9, value="", interactive=True)
	key_message = gr.Textbox(label="Ключевое сообщение", lines=2, value="", interactive=True)

	product_dropdown.change(
	fn=lambda selected: fill_product_details(selected, data_products),
	inputs=[product_dropdown],
	outputs=[description, product_name, benefits, key_message]
	)

	with gr.Column(scale=1):
	gr.Markdown("Клиент")
	gender_dropdown = gr.Dropdown(label="Пол", choices=["Не выбрано"]+genders, value=None)
	generation_dropdown = gr.Dropdown(label="Поколение", choices=["Не выбрано"]+generations, value=None)
	psychotype_dropdown = gr.Dropdown(label="Психотип", choices=["Не выбрано"]+psychotypes, value=None)
	business_stage_dropdown = gr.Dropdown(label="Стадия бизнеса", choices=["Не выбрано"]+business_stages, value=None)
	industry_dropdown = gr.Dropdown(label="Отрасль", choices=["Не выбрано"]+industries, value=None)
	opf_dropdown = gr.Dropdown(label="ОПФ", choices=["Не выбрано"]+opfs, value=None)
	chosen_approach = gr.Textbox(label="Выбранный подход", lines=1, value="", interactive=False)
	presence_in_db = gr.Textbox(label="Комментарий", lines=1, value="", interactive=False)

	with gr.Row():
	return_params_btn = gr.Button("Вернуть параметры предыдущего запроса")
	set_unused_params_btn = gr.Button("Задать ранее невыставленные параметры")
	create_personal_sms_btn = gr.Button("Создать персонализированное SMS")

	with gr.Row():
	with gr.Column():
	model_1_name = gr.Textbox(label="Модель 1", value="Grok-2-1212", interactive=False)
	prompt_1 = gr.Textbox(label="Промпт 1", value="", interactive=False, lines=10)
	sms_1 = gr.Textbox(label="SMS 1", lines=3, value="", interactive=False)

	with gr.Column():
	model_2_name = gr.Textbox(label="Модель 2", value="Grok-2-1212", interactive=False)
	prompt_2 = gr.Textbox(label="Промпт 2", value="", interactive=False, lines=10)
	sms_2 = gr.Textbox(label="SMS 2", lines=3, value="", interactive=False)

	with gr.Row():
	prefer_sms_1_btn = gr.Button("Я предпочитаю это SMS")
	prefer_sms_2_btn = gr.Button("Я предпочитаю это SMS")

	regen_btn = gr.Button("Перегенерировать SMS (не нравится ни одно из SMS)")

	with gr.Row():
	comment_sms_1 = gr.Textbox(label="Комментарий к SMS 1", lines=2, value="")
	comment_sms_2 = gr.Textbox(label="Комментарий к SMS 2", lines=2, value="")

	with gr.Row():
	corrected_sms_1 = gr.Textbox(label="Откорректированное SMS 1", lines=3, value="")
	corrected_sms_2 = gr.Textbox(label="Откорректированное SMS 2", lines=3, value="")

	with gr.Row():
	save_sms_1_btn = gr.Button("Сохранить в базу")
	save_sms_2_btn = gr.Button("Сохранить в базу")

	# Обновляем промпты при изменении параметров клиента
	client_params = [gender_dropdown, generation_dropdown, psychotype_dropdown, business_stage_dropdown, industry_dropdown, opf_dropdown]
	for cp in client_params:
	cp.change(
	fn=update_prompts_on_params_change,
	inputs=[description, product_name, benefits, key_message,
	gender_dropdown, generation_dropdown, psychotype_dropdown,
	business_stage_dropdown, industry_dropdown, opf_dropdown],
	outputs=[chosen_approach, prompt_1, prompt_2]
	)

	# Генерация SMS по нажатию кнопки
	create_personal_sms_btn.click(
	fn=generate_personal_sms,
	inputs=[description, product_name, benefits, key_message,
	gender_dropdown, generation_dropdown, psychotype_dropdown,
	business_stage_dropdown, industry_dropdown, opf_dropdown,
	chosen_approach, prompt_1, prompt_2],
	outputs=[sms_1, sms_2]
	)

	demo.queue().launch()