Une étude pionnière utilisant l’intelligence artificielle (IA) a démontré une nouvelle approche pour étudier la relation entre la taille des feuilles et le climat chez différentes espèces végétales. La recherche, menée par Wilde et ses collègues et publiée dans le Journal américain de botanique, utilise l’apprentissage automatique pour analyser de grandes quantités de données provenant de collections d’herbiers numérisées. Cette méthode innovante pourrait offrir des informations sans précédent sur la manière dont les plantes s’adaptent à leur environnement.

Les collections d’herbiers sont des bibliothèques de spécimens de plantes conservés, datant souvent de plusieurs siècles. Ils sont un trésor d’informations biologiques, mais leur ampleur et leur complexité les ont traditionnellement rendus difficiles à analyser. L’apprentissage automatique, une branche de l’IA, pourrait automatiser le processus de mesure, augmentant considérablement les données disponibles pour l’étude.

L’équipe de recherche a utilisé un type d’IA connu sous le nom de réseaux de neurones convolutifs (CNN), qui sont particulièrement aptes à analyser des images. Ils ont formé ces CNN pour identifier et mesurer les feuilles dans les images de spécimens de plantes de deux genres : Syzygiumun groupe de plantes à fleurs de la famille des myrtes, et ficusplus communément appelées figues.

Syzygium feuilles. Image : Toile

« Dans cette étude, nous voulions trouver et compter les pixels dans les feuilles, comme mesure de surface, de largeur et de longueur. Nous avons commencé avec des feuilles simples, avec des marges lisses, comme preuve de concept, mais nous aimerions beaucoup étendre cela à des formes de feuilles plus complexes », ont déclaré les auteurs dans un e-mail.

L’équipe a formé deux versions du modèle CNN, une avec une sélection aléatoire d’images et une autre avec des images sélectionnées par l’utilisateur. Les performances de ces modèles ont ensuite été testées à l’aide d’un ensemble d’images de validation. Par la suite, les modèles validés ont été appliqués à plus de 3 800 spécimens numérisés de l’Herbier national de la Nouvelle-Galles du Sud, Australie.

« Ces spécimens ont tous été photographiés récemment dans le cadre d’une vaste initiative de numérisation. Cela signifiait que les photos étaient prises dans des conditions uniformes, avec un équipement similaire, configuré de manière constante, donc elles étaient bien standardisées. Des initiatives de numérisation similaires sont en cours chez Herbaria dans le monde entier, il sera donc bientôt possible d’appliquer des méthodes similaires à un grand nombre d’images (avec des ajustements pour la résolution, etc.) « , ont déclaré les auteurs.

Les résultats étaient prometteurs. L’approche de formation sélectionnée par l’utilisateur était plus efficace, trouvant plus de feuilles et une gamme plus large de tailles de feuilles que le modèle formé de manière aléatoire. Cela indique qu’un degré d’implication humaine experte peut améliorer l’efficacité de l’IA dans des tâches aussi complexes.

« Le modèle human-in-the-loop était particulièrement utile ici où nous voulions minimiser la quantité de données d’entraînement nécessaires pour générer un modèle robuste. Si à l’avenir nous restons limités par les données d’entraînement, il pourrait y avoir longtemps un rôle pour ces approches. Si, d’un autre côté, les efforts mondiaux pour former des modèles aboutissent à de grandes bibliothèques de données de formation, peut-être que le volume remplacera les avantages de la sélectivité humaine », ont déclaré les auteurs.

En ce qui concerne le lien entre la taille des feuilles et le climat, les modèles CNN ont confirmé que, chez différentes espèces, des feuilles plus grandes étaient associées à des climats plus chauds et plus humides, conformément aux études précédentes. Cependant, la relation n’était pas aussi claire au sein des espèces individuelles, ce qui suggère que d’autres facteurs, tels que la variation génétique et l’histoire de la population, pourraient influencer la taille des feuilles.

« Nous voyons que si nous nous déplaçons d’un point du sud-est de l’Australie à un point plus chaud du nord-est de l’Australie, en moyenne, la taille d’un Syzygium la feuille grossit. Cela semble être principalement dû au fait qu’il existe des espèces avec de plus grandes feuilles dans le nord. Si nous examinons les feuilles d’une seule espèce largement distribuée aux deux mêmes endroits, en moyenne, nous constatons que les feuilles ont à peu près la même taille », ont déclaré les auteurs dans leur e-mail.

« L’explication est probablement liée à l’histoire ou aux processus évolutifs, au sein des espèces. Par exemple, au sein d’une espèce, des populations éloignées sont encore probablement liées par un flux de gènes. Cela peut être indirect, par exemple via des mouvements de pollen relativement courts entre populations voisines, au fil des générations. Cela signifie que les allèles génétiques qui influencent la taille des feuilles sont susceptibles d’être partagés entre les populations, homogénéisant la taille des feuilles entre les populations.

« Si la sélection favorisait les feuilles plus grandes dans le nord, le bénéfice associé aux feuilles plus grandes devrait être assez fort pour surmonter l’effet du flux de gènes. Il est également possible que certaines espèces largement distribuées aient subi une expansion démographique récente, ce qui conduirait également à des populations ayant des valeurs de traits similaires dans de vastes zones géographiques. Par conséquent, les processus évolutifs (par exemple, le flux de pollen) et les histoires (par exemple, l’expansion de la population) pourraient conduire à différents liens trait-climat observés au sein des espèces.

Si vous suivez l’actualité concernant l’IA, alors les résultats pourraient être intéressants, mais la méthode pourrait être opaque. Il est essentiel non seulement que vous sachiez des choses, mais aussi que vous sachiez Comment savez-vous choses. C’est un problème que Wilde et ses collègues abordent dans leur article.

« Les modèles complexes d’apprentissage automatique (réseaux de neurones, etc.) sont moins faciles à comprendre que les modèles statistiques qui ont été omniprésents dans les sciences végétales et biologiques jusqu’à présent. Cependant, nous arrivons à un point où il existe une base solide pour les utiliser et bénéficier de leur énorme pouvoir inférentiel, de manière fiable et robuste », ont déclaré les auteurs dans leur e-mail.

« Cette base pour une utilisation rationnelle du ML repose sur les processus de validation et de test des modèles. Cela implique de prendre des données (images) qui ne sont pas utilisées pour former un modèle et d’ajouter des étiquettes à ces données des caractéristiques qu’un modèle bien formé devrait trouver. Nous pouvons alors demander, quantitativement, dans quelle mesure un modèle fonctionne lorsqu’il affiche les données. Trouve-t-il toutes les feuilles qui s’y trouvaient ? Arrive-t-il à éviter d’appeler des choses des feuilles qui n’étaient pas des feuilles ? Où trouve-t-il correctement une feuille, parvient-il à une estimation précise de sa taille, en termes de pixels ? Si un modèle d’apprentissage automatique peut bien fonctionner par rapport à ces questions, pour un ensemble suffisamment large et représentatif de données d’entraînement, nous devenons confiants dans le modèle.

Une fois que vous disposez d’une méthode de mesure robuste, vous pouvez également étendre ce que vous mesurez. « Nous avons également utilisé des modèles d’apprentissage automatique pour trouver une gamme d’autres structures dans des spécimens d’herbier, y compris des bourgeons, des fruits et des fleurs – il y a donc certainement beaucoup de possibilités d’étendre à d’autres structures », déclarent les auteurs dans leur e-mail. Il y a aussi l’espoir de pouvoir étendre le type de mesures que vous pouvez faire dire. « Nous avons pensé à utiliser l’apprentissage automatique pour effectuer des mesures sur le terrain d’autres traits foliaires qui sont mal représentés par les spécimens conservés, mais ce travail est encore en cours de développement ! »

LIRE L’ARTICLE

Wilde, BC, Bragg, JG et Cornwell, W. (2023) « Analyse des relations trait-climat au sein et entre les taxons à l’aide d’apprentissage automatique et de spécimens d’herbier, » Journal américain de botanique, p. e16167. Disponible sur : https://doi.org/10.1002/ajb2.16167.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *