Ceux qui développent des méthodes de séparations chromatographiques le savent bien : séparer des mélanges (complexes) demande beaucoup de travail. Mais avec la naissance de du machine learning, un groupe de l’Université de Louvain parvient à accélérer efficacement le processus. Les personnes sont souvent bloquées par leurs propres méthodes.
La chromatographie est une technique essentielle utilisée en laboratoire pour séparer des mélanges. Cependant, l’optimisation d’une séparation implique souvent beaucoup d’essais et d’erreurs, consommant beaucoup de temps et de ressources. « Chaque personne impliquée dans la chromatographie aborde le développement de la méthode à sa manière, en se basant principalement sur son expérience » explique Deirdre Cabooter, professeur d’analyse pharmaceutique à la KU Leuven. « Nous voulons aborder le développement de méthodes plus efficacement en utilisant le machine learning. »
C’est pourquoi Alexander Kensert s’est avéré utile : il a fait son doctorat sur ce projet en tant qu’expert en machine learning et est actuellement post-doctorant dans le groupe de Cabooter. Lorsque j’ai commencé au laboratoire de Deirdre, je cherchais littéralement des problèmes » explique Kensert. « En général, c’est l’inverse : il y a un problème à résoudre pour lequel vous essayer de trouver une solution. Mais j’avais déjà la solution et j’avais besoin d’un problème à résoudre. » Il travaillait principalement sur trois projets de machine learning : le traitement du signal (à l’aide de réseaux neuronaux convolutifs), la modélisation du temps de rétention (à l’aide de réseaux neuronaux graphiques) et l’optimisation des méthodes (à l’aide de l’apprentissage par reinforcement learning). « Nous voulons éliminer le bruit des chromatogrammes complexes afin de mieux localiser les pics. Il est également utile de trouver des corrélations entre la structure d’une molécule et son temps de rétention. Enfin, nous voulons sélectionner de manière intelligente et automatique les bons paramètres chromatographiques pour une séparation optimale. »
Artificiel
Toutefois, ce n’est pas aussi simple qu’il y paraît. « Actuellement, il faut beaucoup de données pour que les algorithmes de machine learning puissent apprendre efficacement » explique Cabooter. « Mais il est très coûteux et fastidieux de générer un grand nombre de données à partir d’échantillons et de mesures réels. » Les chercheurs génèrent à la place des chromatogrammes artificiels qui reflètent la réalité pour former les algorithmes. Kensert explique : « Vous ne pouvez pas apprendre sans de bons exemples, nous avons donc dû créer des simulateurs qui génèrent ces chromatogrammes pour s’entraîner. » Cependant Cabooter souligne que des vrais exemples sont également utilisés. « Tous les membres de notre groupe font de la chromatographie, ce qui nous permet d’utiliser ces données et de tester l’algorithme en même temps » explique-t-elle. « C’est un moyen rapide de l’améliorer. » Selon Kensert, le plus grand défi consiste à obtenir des données ou des exemples de bonne qualité. « Ils sont nécessaires pour entraîner le modèle de machine learning à faire des prédictions utiles. Nous avons déjà fait beaucoup de chemin avec la modélisation de la rétention, avec des preuves de bonnes performances et d’interprétabilité. » Il a également progressé dans les algorithmes de traitement du signal. « Nous avons encore besoin d’une validation et de tests supplémentaires » admet Kensert, « mais nous avons réussi à développer des modèles et à publier les résultats dans le Journal of Chromatography A. »
Secondes
Actuellement, les algorithmes de machine learning se concentrent principalement sur les petites molécules pertinentes pour le secteur pharmaceutique. « Mais l’objectif est de voir plus loin » explique Cabooter. « Nous avons récemment commencé à travailler avec des biomolécules de plus grande taille, et nous essayons également de mettre en œuvre les algorithmes correspondants. Au final, ces algorithmes seront utiles à toute personne impliquée dans la chromatographie liquide » précise Cabooter. « Dans tous les domaines d’analyse, qu’il s’agisse de la recherche alimentaire ou environnementale, des méthodes de chromatographie sont développées. Nous perdons beaucoup de temps à effectuer ces analyses manuellement, l’apprentissage automatique peut donc aider beaucoup de personnes. » L’un des étudiants du professeur Cabooter a déjà expérimenté les avantages des algorithmes de Kensert. Au lieu de passer des semaines à analyser lui-même les données, l’ordinateur a terminé le travail en quelques secondes. Ainsi, d’une part, l’ordinateur doit apprendre à partir de toutes les données que vous lui fournissez. D’autre part, vous pouvez aussi apprendre vous-même de la machine. « L’amélioration de l’interprétabilité des modèles d’apprentissage automatique est un sujet d’actualité » déclare Kensert. « Nous essayons, dans le cadre d’un de nos projets, de comprendre quelle partie de la molécule le modèle de machine learning examine lorsqu’il fait des prédictions sur le temps de rétention. Nous pourrions ainsi mieux comprendre quelles sous-structures pourraient être importantes pour la rétention afin de mieux comprendre les processus chromatographiques. »
Les chercheurs espèrent apporter une contribution importante à la chromatographie, non seulement en termes de méthodologie, mais aussi en termes de compréhension. Cabooter explique que : « Les personnes s’enferment dans leurs propres méthodes et pensent que la manière dont ils ont toujours procédé au développement est la meilleure. Mais la chromatographie demande encore beaucoup de temps, y compris les ajustements manuels, la vérification des paramètres, etc. Ce n’est tout simplement pas optimal. J’espère que l’ordinateur nous apprendra quelle est la meilleure façon de procéder. »
Nog geen opmerkingen