Avec plus de 6 millions d'hectares et 20 millions de tonnes de production par an, le colza est la première culture oléagineuse Européenne. Un de ses principaux débouchés est l'alimentation humaine, avec la possibilité de produire une huile de haute qualité, riche en acides gras omega3. Par ailleurs les tourteaux, coproduits de la trituration des graines de colza (extraction de l'huile), constituent une source de protéines de qualité pour les bovins, ovins et porcins. Ces produits issus des graines de colza représentent des productions à haute valeur ajoutée, soumises à des cahiers des charges précis. Or, le contexte actuel de changement climatique et de réduction des intrants, conduit à une diversification des milieux de cultures, avec une plus grande expression des stress. Afin de remplir les cahiers des charges qui leur sont imposés, les agriculteurs doivent alors se placer dans des conditions favorables en adaptant le choix de la variété au milieu de culture. Cela implique de comprendre et prédire les interactions génotype x environnement x conduite (IGEC) [1] s'appliquant sur la qualité de la graine. L'objectif de cette étude, réalisé dans le cadre du projet POLYGONE, est alors de rechercher un ensemble de variables environnementales explicatives de la qualité des graines.
Les données utilisées sont issues d'un réseau de 10 lieux sur lesquels 8 variétés de colza ont étés cultivées. Pour chaque individu, autrement dit chaque variété dans un lieu, la qualité des graines est définie par les teneurs en huile, protéines et glucosinolates, ainsi que par leur profil en acide gras, dont particulièrement les acides oléique (C18:1 ω-9), linoléique (C18:2 ω-6) et linolénique (C18:3 ω-3) [2]. Chaque lieu est caractérisé par un ensemble de variables candidates calculées à partir de données météorologiques, quantifiant les stress rencontrés, comme le déficit hydrique [3], les fortes ou très basses températures [4], et ceci sur les stades sensibles de culture [5].
L'ensemble des 40 variables explicatives candidates, sont très corrélées entre elles (cf. figure ci-dessous). Les méthodes statistiques linéaires sont donc à proscrire dans un premier temps. Nous ferons donc appel à des méthodes telles que la régression PLS [6] et LASSO [7] [8]. Ces approches nous permettrons de restreindre par régularisation l'espace des solutions, afin de limiter l'effet de la multicolinéarité des covariables. Aussi, divers critères comme R² ajusté, PRESS, RMSE, VIP seront utilisés afin d'évaluer la qualité explicative de chaque variables, pour ainsi sélectionner les plus pertinentes.
Dans le but d'améliorer le conseil variétal, cette étude représente l'étape préliminaire indispensable à l'analyse des interactions génotype x environnement x conduite, appliquée à la qualité des graines de colza.
- Poster