Spaces:

hackathon-ombrea
/

gaia

Runtime error

App Files Files Community

Rim BACCOUR commited on Feb 25

Commit

9c23216

unverified ·

1 Parent(s): d7f6de5

add prompt to compare both scenarii with and without ombrage

Browse files

Files changed (4) hide show

prompts/summary_prompt.py +28 -2
summary_test.py +52 -3
utils/soil_utils.py +39 -0
utils/summary.py +42 -3

prompts/summary_prompt.py CHANGED Viewed

@@ -1,6 +1,6 @@
-""" This file contains prompts for the different LLM """
-metrological_data_summary_prompt = """
     Tu es un expert en météorologie et en analyse climatique.
     Ta mission est de fournir une synthèse détaillée de l’évolution des conditions météorologiques d’une région donnée.
     Tu exploites trois indicateurs clés : la température, les précipitations et l’irradiance solaire.
@@ -19,7 +19,33 @@ metrological_data_summary_prompt = """
     - L’évolution passée et future des températures.
     - L'évolution de la tendances des précipitations.
     - Les variations de l’irradiance solaire.
     avec des pourcentage de variation du futur par rapport aux années passées et en spécifiant les dates
     Présente ta réponse sous un format structuré avec un résumé des tendances observées et des perspectives climatiques selon le scénario choisi."
 """

+""" This file contains prompts for different LLM uses """
+meterological_data_summary_prompt = """
     Tu es un expert en météorologie et en analyse climatique.
     Ta mission est de fournir une synthèse détaillée de l’évolution des conditions météorologiques d’une région donnée.
     Tu exploites trois indicateurs clés : la température, les précipitations et l’irradiance solaire.
     - L’évolution passée et future des températures.
     - L'évolution de la tendances des précipitations.
     - Les variations de l’irradiance solaire.
     avec des pourcentage de variation du futur par rapport aux années passées et en spécifiant les dates
     Présente ta réponse sous un format structuré avec un résumé des tendances observées et des perspectives climatiques selon le scénario choisi."
+"""
+agricultural_yield_comparison_prompt = """
+    Tu es un expert agronome et spécialiste en agrivoltaïsme chez Ombrea (entreprise spécialisée en agrivoltaisme).
+    Ta mission est d’analyser et de comparer deux scénarios agricoles :
+    Un avec ombrage statique apporté par les panneaux photovoltaïques sur la culture et un sans ombrage.
+    Tu dois conseiller un agriculteur sur la meilleure solution pour optimiser son rendement agricole.
+    Il faut se concentrer sur la vision long terme qui prend en compte les aléas climatiques.
+    Tu dois baser ton analyse sur les données suivantes :
+        * Caractéristiques du sol : [pH, texture, teneur en matière organique, capacité de rétention d’eau, etc.]
+        * Type de culture : [Nom de la culture et ses besoins spécifiques en lumière, température et eau]
+        * Besoins hydriques : [Quantité d’eau requise et sensibilité au stress hydrique]
+        * Projections climatiques : [Température moyenne, précipitations, risques de sécheresse, vagues de chaleur, etc.]
+    Ton analyse devra inclure :
+        - Comparaison des rendements agricoles : Différences de productivité avec et sans ombrage agrivoltaïque.
+        - Impact sur la consommation d’eau : Évaluation des économies d’eau potentielles grâce à la régulation thermique et l’ombrage.
+        - Effet sur la qualité des cultures : Influence des conditions microclimatiques créées par l’agrivoltaïsme.
+        - Bilan économique : Gains estimés en production et en coûts d’irrigation.
+    Formule une réponse détaillée et pédagogique pour l’agriculteur, en expliquant pourquoi l’un des scénarios est plus avantageux.
+    Par exp: Grâce à l’ombrage : Le rendement agricole serait de +X%, Les besoins en eau seraient donc [réduit] de X%.
+    Tu devras vulgariser les concepts techniques pour une meilleure compréhension, en te basant sur des données input et des retours d’expérience.
+    L'utilisateur te founira le nom de la culture, les caractéristiques du sol dans la région en question et les données des rendements avec et sans ombrage.
 """

summary_test.py CHANGED Viewed

@@ -2,7 +2,7 @@ import pandas as pd
 import pandas as pd
 import numpy as np
-from utils.summary import get_summary
 # Générer des dates sur 5 ans (historique) + 5 ans (prévision)
 dates_past = pd.date_range(start="2023-01-01", periods=36, freq='ME')  # 3 ans d'historique
 dates_future = pd.date_range(start="2023-01-01", periods=60, freq='ME')  # 5 ans de prévisions
@@ -61,6 +61,55 @@ print(rain_df.head(3))
 print("\nIrradiance (extrait) :")
 print(irradiation_df.head(3))
-summary = get_summary(scenario, temperature_df, rain_df, irradiation_df)
-print(summary)

 import pandas as pd
 import numpy as np
+from utils.summary import get_meterological_summary, get_agricultural_yield_comparison
 # Générer des dates sur 5 ans (historique) + 5 ans (prévision)
 dates_past = pd.date_range(start="2023-01-01", periods=36, freq='ME')  # 3 ans d'historique
 dates_future = pd.date_range(start="2023-01-01", periods=60, freq='ME')  # 5 ans de prévisions
 print("\nIrradiance (extrait) :")
 print(irradiation_df.head(3))
+if __name__ == "__main__":
+    # summary = get_meterological_summary(scenario, temperature_df, rain_df, irradiation_df)
+    # print(summary)
+    # Example usage
+    import pandas as pd
+    import numpy as np
+    from utils.soil_utils import find_nearest_point
+    city = "Bourgogne Franche Comté"
+    closest_soil_features = find_nearest_point(city)
+    print(closest_soil_features)
+    # Définir la période de 4 ans dans le passé + 15 ans dans le futur (19 ans)
+    start_date = "2010-01"
+    end_date = "2029-12"
+    # Générer une série de dates mensuelles
+    dates = pd.date_range(start=start_date, end=end_date, freq='M')
+    # Générer des données fictives de rendement (en tonnes par hectare)
+    np.random.seed(42)  # Pour reproductibilité
+    # Tendance générale du rendement sans ombrage (augmentation progressive)
+    trend = np.linspace(2.5, 3.2, len(dates))  # Augmente légèrement sur les années
+    # Ajout de variations saisonnières et aléatoires
+    seasonality = 0.3 * np.sin(np.linspace(0, 12 * np.pi, len(dates)))  # Effet saisonnier
+    random_variation = np.random.normal(0, 0.1, len(dates))  # Bruit aléatoire
+    # Calcul du rendement sans ombrage
+    yield_no_shade = trend + seasonality + random_variation
+    # Appliquer un effet d'ombrage (réduction de 10-20% du rendement)
+    shade_factor = np.random.uniform(0.1, 0.2, len(dates))  # Entre 10% et 20% de réduction
+    yield_with_shade = yield_no_shade * (1 - shade_factor)
+    # Créer le DataFrame
+    df = pd.DataFrame({
+        "date": dates,
+        "yield_no_shade": yield_no_shade,
+        "yield_with_shade": yield_with_shade
+    })
+    water_deficit_data = pd.DataFrame()
+    climate_data = pd.DataFrame()
+    print(get_agricultural_yield_comparison(culture="orge",
+                                            region="bourgogne franche comté",
+                                            water_df=water_deficit_data,
+                                            climate_df=climate_data,
+                                            soil_df=closest_soil_features,
+                                            agri_yield_df=df))

utils/soil_utils.py ADDED Viewed

	@@ -0,0 +1,39 @@

+import json
+import geopandas as gpd
+from dotenv import load_dotenv
+from geopy.geocoders import Nominatim
+from shapely.geometry import Point
+load_dotenv()
+file_rmqs ='data/soil_data/raw_data/rmqs.geojson'
+df = gpd.read_file(file_rmqs)
+def get_city_coordinates(city_name):
+    """Get latitude and longitude of a city using Nominatim."""
+    geolocator = Nominatim(user_agent="geo_finder")
+    location = geolocator.geocode(city_name)
+    if location:
+        return (location.longitude, location.latitude)
+    return None
+def find_nearest_point(city_name):
+    """Find the closest GPS point in the dataset to the given city."""
+    city_coords = get_city_coordinates(city_name)
+    print("city coords", city_coords)
+    if not city_coords:
+        return "City not found"
+    # Iterate through GeoJSON features
+    df["distance"] = df["geometry"].distance(Point(city_coords[0], city_coords[1]))
+    closest_point = df.loc[df["distance"].idxmin()]
+    return closest_point  # Returns the closest feature
+if __name__ == "__main__":
+    # Example usage
+    city = "Paris"
+    closest_feature = find_nearest_point(city)
+    print(closest_feature)

utils/summary.py CHANGED Viewed

@@ -5,12 +5,15 @@ from dotenv import load_dotenv
 from langchain_core.output_parsers import StrOutputParser
 from langchain.prompts import ChatPromptTemplate
 from langchain.chat_models import ChatOpenAI
-from prompts.summary_prompt import metrological_data_summary_prompt
 load_dotenv()
-def get_summary(scenario: str, temperature_df: pd.DataFrame, rain_df: pd.DataFrame, irradiance_df: pd.DataFrame) -> str:
     today = datetime.today().strftime("%Y/%m/%d")
@@ -29,7 +32,7 @@ def get_summary(scenario: str, temperature_df: pd.DataFrame, rain_df: pd.DataFra
     output_parser = StrOutputParser()
     prompt = ChatPromptTemplate.from_messages(
         [
-            ("system", metrological_data_summary_prompt),
             ("human", "Je veux un résumé de ces prévisions métérologique: les données de temperature {temp_data}, les données de précipitation {rain_data}, les données de radiance solaire {irradiance_data}")
         ]
     )
@@ -43,4 +46,40 @@ def get_summary(scenario: str, temperature_df: pd.DataFrame, rain_df: pd.DataFra
         "irradiance_data": irradiance_data
     })
     return output_parser.parse(response)

 from langchain_core.output_parsers import StrOutputParser
 from langchain.prompts import ChatPromptTemplate
 from langchain.chat_models import ChatOpenAI
+from prompts.summary_prompt import (
+    meterological_data_summary_prompt,
+    agricultural_yield_comparison_prompt
+)
 load_dotenv()
+def get_meterological_summary(scenario: str, temperature_df: pd.DataFrame, rain_df: pd.DataFrame, irradiance_df: pd.DataFrame) -> str:
     today = datetime.today().strftime("%Y/%m/%d")
     output_parser = StrOutputParser()
     prompt = ChatPromptTemplate.from_messages(
         [
+            ("system", meterological_data_summary_prompt),
             ("human", "Je veux un résumé de ces prévisions métérologique: les données de temperature {temp_data}, les données de précipitation {rain_data}, les données de radiance solaire {irradiance_data}")
         ]
     )
         "irradiance_data": irradiance_data
     })
+    return output_parser.parse(response)
+def get_agricultural_yield_comparison(culture: str, region:str, agri_yield_df: pd.DataFrame, soil_df: pd.DataFrame, climate_df: pd.DataFrame, water_df: pd.DataFrame):
+    agricultural_yield = agri_yield_df.head(len(agri_yield_df)).to_string(index=False)
+    soil_data = soil_df.head(len(soil_df)).to_string(index=False)
+    water_data = water_df.head(len(water_df)).to_string(index=False)
+    climate_data = climate_df.head(len(climate_df)).to_string(index=False)
+    llm = ChatOpenAI(
+        model="gpt-4o",
+        temperature=0,
+        max_tokens=None,
+        timeout=None,
+        max_retries=2,
+        api_key=os.environ.get("OPENAI_API_KEY")
+        )
+    output_parser = StrOutputParser()
+    prompt = ChatPromptTemplate.from_messages(
+        [
+            ("system", agricultural_yield_comparison_prompt),
+            ("human", "Je suis agriculteur et je cultive de la {culture} à {region}. Voilà les caractéristiques du sol dans ma région {soil_data} et voilà l'historique et projections du rendement ma culture avec et sans ombrage {agricultural_yield}. J'ai aussi les donnés historiques et prévisions du stress hydrique {water_data} et des données climatiques {climate_data}. " )
+        ]
+    )
+    chain = prompt | llm | output_parser
+    response = chain.invoke({
+        "culture": culture,
+        "region": region,
+        "soil_data": soil_data,
+        "water_data": water_data,
+        "climate_data": climate_data,
+        "agricultural_yield": agricultural_yield
+    })
     return output_parser.parse(response)