L’intégration de l’apprentissage automatique et de la modélisation des cultures peut optimiser les prévisions de croissance et de rendement des plantes.
Alors que le changement climatique s’intensifie, les scientifiques s’efforcent de trouver les méthodes, algorithmes ou modèles les plus performants pour simuler l’impact des températures élevées et/ou de la disponibilité limitée de l’eau sur la croissance, le développement et la productivité des cultures. La complexité des interactions plante-environnement rend cela difficile, mais de nouvelles recherches ont montré que l’intégration de l’apprentissage automatique et de la modélisation des cultures peut fournir les réponses nécessaires.
Dr. Ioannis Droutsas, chercheur à l’Université de Leeds, et co-auteurs ont intégré des algorithmes d’apprentissage automatique (ML) dans un modèle de culture basé sur des processus pour créer un nouveau cadre de modélisation/ML des cultures avec des performances élevées dans la représentation de la réponse des cultures à un large éventail de environnements, y compris les conditions de stress.
Les auteurs ont modifié le modèle de culture basé sur les processus existant GLAM-Parti en intégrant des algorithmes d’apprentissage automatique pour estimer les variables qui échappent régulièrement à la capacité prédictive du modèle de culture. . ML a été utilisé pour les prédictions quotidiennes de l’efficacité de l’utilisation des rayonnements, du taux de changement de l’indice de récolte et du stade phénologique.
Pour l’évaluation du nouveau cadre GLAM-Parti-ML, les auteurs ont utilisé un ensemble de données existant pour un cultivar de blé cultivé dans une large gamme de températures, de rayonnement solaire et de conditions d’humidité atmosphérique, y compris l’exposition au stress thermique. La moitié des données a été utilisée pour former les algorithmes d’apprentissage automatique et l’autre moitié pour tester le modèle.
Le modèle a été exécuté avec les entrées météorologiques température, rayonnement solaire et déficit de pression de vapeur, les déterminants météorologiques les plus importants de la croissance du blé pour des conditions irriguées et bien fertilisées. Les rendements de biomasse et de rendement en grain, ainsi que les jours jusqu’à l’anthèse et la maturité ont été comparés aux mesures de terrain en fin de saison.
L’équipe a appliqué Random Forests et Extreme Gradient Boosting. Les deux modèles ML ont montré une grande efficacité dans l’apprentissage des modèles entre les intrants et la performance des cultures (en termes d’efficacité d’utilisation du rayonnement) au cours de la saison de croissance. Cela a abouti à une bonne compétence de modèle pour la biomasse des cultures ; GLAM-Parti-ML a reproduit 98 % de la variance observée à la fois dans la biomasse et le rendement en grain et l’erreur du modèle était inférieure à 20 %. De plus, le modèle a reproduit au moins 98 % de la variance observée dans les jours jusqu’à l’anthèse et la maturité avec moins de 11 % d’erreur. Néanmoins, le début des deux stades phénologiques a été sous-estimé, prédisant ainsi l’anthèse et la maturité plus tôt qu’observé.


Ensuite, GLAM-Parti a été comparé à son prédécesseur, GLAM, un modèle de culture basé sur les processus sans intégration d’apprentissage automatique. GLAM a été calibré avec 100% des données et GLAM-Parti avec seulement 50%. Néanmoins, GLAM-Parti-ML avait des valeurs d’erreur plus faibles pour la biomasse, le rendement et les jours jusqu’à la maturité et l’anthèse, ce qui indique que les paramétrisations d’apprentissage automatique ont amélioré le modèle bien qu’elles aient été formées sur seulement la moitié des données.
Pour évaluer plus en détail GLAM-Parti-ML, les auteurs ont utilisé un deuxième ensemble de données de trois cultivars de blé cultivés dans de nombreuses expériences sur le terrain dans six pays. Encore une fois, la moitié des données a été utilisée pour former les algorithmes d’apprentissage automatique et l’autre moitié pour tester le modèle.


Une fois de plus, le modèle a eu d’excellentes performances. Il a reproduit 73 % de la variation de la biomasse entre les emplacements et les cultivars avec une erreur de 15 % et 76 % de la variation du rendement en grain avec une erreur de 16 %. La phénologie de la culture était plus précise pour les jours jusqu’à la maturité (erreur de 9,9 %) que pour l’anthèse (erreur de 13,2 %). Il y avait à nouveau un biais négatif dans la prédiction des deux stades phénologiques.
Droutsas conclut que « l’utilisation d’un ensemble de données d’entraînement plus important améliorerait considérablement les simulations du modèle. Cependant, peu d’ensembles de données avec les mesures requises existent.
LIRE L’ARTICLE:
Ioannis Droutsas, Andrew J Challinor, Chetan R Deva, Enli Wang, Intégration de l’apprentissage automatique dans la modélisation basée sur les processus pour améliorer la simulation des réponses complexes des cultures, in silico Plants, 2022, diac017, https://doi.org/10.1093/insilicoplants /diac017