AI Models Cooking Molecules – Not Rachel's English Trifle

Trifle


En tant que laboratoires, les chercheurs en vaccins et les acteurs pharmaceutiques travaillent sans relâche pour trouver des réponses pour lutter contre la crise de Covid-19; IBM apporte plus de mains IA pour rejoindre le pont.

L'horloge tourne. Les volutes de vapeurs flottent. Les casseroles et les poêles transpirent. Mais dans ce niveau de cuisson sous pression Master-Chef, aucune perle de transpiration ne laisse un front humain. Raison? C’est un robot qui décompose et recrée une recette dans ce laboratoire!

L’idée de synthétiser et de re-synthétiser des molécules à l’aide de l’intelligence artificielle (IA) est une idée trop géniale pour se faire la tête dès le premier effort. Après tout, il est facile de mélanger les pages de recette d'un dessert traditionnel en couches avec celle d'une tarte de berger (comme l'a fait la pauvre Rachel dans ce célèbre épisode de Friends quand elle a fouetté par erreur du bœuf haché ou de l'agneau, des pois, des oignons et de la crème anglaise ensemble) .

Mais IBM veut maintenant changer ce problème de «colle accidentelle sur les livres de recettes» pour les cuisines de chimie. Un groupe de scientifiques d'IBM Research Europe utilise l'IA, la technologie cloud et la robotique pour atteindre cet objectif. Il y a environ trois ans, cette équipe a commencé à développer des modèles d'apprentissage automatique (ML) pour prédire les réactions chimiques. Ils ont proposé RXN pour la chimie – une méthode de traduction neuronale ML pour prédire le résultat le plus probable d'une réaction chimique à l'aide d'architectures de traduction automatique neuronale. Comme le prétend la description de la solution par l’équipe, elle traduit le langage de la chimie convertissant les réactifs et les réactifs en produits, en utilisant la représentation SMILE pour décrire les entités chimiques.

On pourrait, à juste titre, soulever des préoccupations qui rendent ce concept difficile à croire – comme le degré de précision et de rapidité, le manque de parti pris et de transparence – mais que se passe-t-il s'ils sont confrontés et traités avec force avec un exemple de laboratoire en direct!

Quelque chose qu'IBM RoboRXN a exposé aujourd'hui lors d'une réunion mondiale de démonstration en direct. Des experts comme le Dr Teodoro Laino, le Dr Alain Vaucher et le Dr Matteo Manica d'IBM ont montré comment le modèle fonctionne réellement dans une gamme réelle de tubes à essai et d'accessoires chimiques. Ils ont montré comment RoboRXN utilise un algorithme d'apprentissage automatique pour concevoir (IA) et exécuter (automatiser) la production de molécules dans un laboratoire accessible à distance (Cloud) avec le moins d'intervention humaine possible.

Comme l'a expliqué le Dr Vaucher avec une analogie avec la tarte aux pommes, la fabrication d'une molécule est un processus en plusieurs étapes où l'ensemble spécifique d'ingrédients et la série d'étapes à suivre comptent beaucoup. «Les ingrédients peuvent être difficiles à deviner. Il peut y avoir plusieurs possibilités et façons de les connecter pour une molécule donnée. Vous ne pouvez pas toujours rechercher la recette dans une base de données car l'espace chimique est énorme et le nombre de molécules trop grand. Par conséquent, ce modèle d'IA a été conçu pour déterminer les ingrédients. Il peut faire une analyse de rétro-synthèse et déterminer les actions de synthèse. Le modèle peut fonctionner sur des questions telles que: de quels ingrédients ai-je besoin pour ces molécules? Tout comme une recette de tarte aux pommes nécessite une croûte de tarte et des tranches de pommes, une certaine molécule aurait besoin de certains ingrédients – à mélanger dans un certain ordre. "

Lui et l'équipe ont également souligné l'élégance que vise le modèle en matière de traduction. «Il donne une représentation textuelle et une phrase d'atomes en langage chimique. Les humains peuvent lire la traduction de manière compréhensible tandis que l'IA peut également comprendre ses alphabets chimiques. »

Une fois que le modèle connaît les ingrédients, il peut décrire les instructions pour mélanger, mélanger, concentrer, etc. et vous avancez avec la recette. Il peut convertir les étapes de réaction en un ensemble d'actions structurées. Donc, si l'on a un composé à synthétiser, ces modèles d'IA peuvent être utilisés pour trouver des ingrédients et ensuite poursuivre les étapes de synthèse à exécuter dans un laboratoire. L'équipe a donné un aperçu de l'ensemble de l'approche du cadre RXN, dans laquelle ils ont opté pour un schéma purement basé sur les données. «Cela signifie qu'une fois que l'algorithme d'apprentissage automatique aura acquis suffisamment d'exemples, il sera capable de déterminer par lui-même les mots auxquels il faut faire attention pour extraire les bonnes étapes de production. Le principal avantage d'une telle approche basée sur les données est qu'elle ne repose que sur des données. Pour l'améliorer, il faut simplement plus d'exemples. »

L'équipe a également expliqué le contraste avec d'autres approches, soulignant comment ce modèle d'apprentissage profond convertit les procédures expérimentales dans leur ensemble dans un format structuré et convivial, au lieu de scanner des textes à la recherche d'informations pertinentes.

Expliquant l'anatomie architecturale de ce modèle, l'équipe a évoqué les défis qui étaient anticipés bien à temps. Comme l'infrastructure, la capacité d'afficher les réponses dans un format lisible par l'homme, la capacité de répondre à différents emplacements et composants et de tout mapper sur un matériel de manière simple.

C'est là que l'utilisation d'IBM Cloud en tant que composant d'infrastructure prend en charge l'évolutivité, la haute disponibilité des services et les cycles de déploiement rapides, a déclaré le Dr Manica. «Le traducteur matériel s'occupe d'autres problèmes. Tous les composants sont indépendants du matériel et évolutifs d'un seul laboratoire à une échelle d'usine. La solution est un bon mélange d'infrastructure, d'automatisation, d'IA et de robotique avec une architecture d'intégration solide. » Notamment en 2019, IBM a commencé à collaborer avec un groupe de chimistes organiques synthétiques de l'Université de Pise, en Italie, pour intégrer une architecture rétro-synthétique dans l'outil RXN.

Une attention particulière a également été accordée aux problèmes de conservation des données avec un bon degré de qualité et d'automatisation pour le nettoyage des ensembles de données. L'équipe a expliqué comment le modèle prend en charge les données bruyantes, l'oubli et l'apprentissage des aspects.

Répondant à une question du CIOL sur la pertinence du problème de la «boîte noire» de l’IA dans ce scénario, le Dr Vaucher a déclaré: «Oui, c’est une préoccupation valable. Il s'agit d'un effort continu dans toute l'industrie et géré par les communautés mondiales d'apprentissage automatique. Quelques architectures de modèle ont été publiées pour comprendre les domaines prédécesseurs du modèle. L'architecture spéciale que nous avons nous permet de mieux visualiser le modèle et de comprendre pourquoi une certaine procédure a été choisie. Cela dit, il s’agit d’un effort continu et rigoureux pour concevoir des modèles qui aident les humains à mieux comprendre le «pourquoi» des pièces. »

Répondant aux autres questions des médias concernant la précision, les biais, la proximité avec l'intuition du chimiste et les préoccupations en matière de propriété intellectuelle, l'équipe a expliqué comment la qualité des prévisions dépend en fin de compte des données sur lesquelles le modèle est formé. Avec des niveaux de précision de référence supérieurs à 90%, l'effort consiste à sélectionner la bonne prédiction en fonction de critères tels que la rentabilité ou la confiance. «Le modèle peut créer plusieurs prédictions en même temps pour la rétro-synthèse moléculaire. Notre modèle se concentre entièrement sur la qualité des données, contrairement aux approches qui peuvent être utilisées par d’autres modèles. La sécurité des données et l'assurance de la confidentialité sont intégrées et garanties ici, de sorte que nous n'avons aucun accès à ce que fait l'utilisateur. " Ajout du Dr Vaucher.

Soit dit en passant, les murs actuels auxquels de nombreux efforts mondiaux de vaccination sont confrontés incluent des défis tels que les longs cycles de développement et de fabrication, le taux d’obsolescence des vaccins à la lumière de l’évolution rapide du virus et d’autres défis au niveau des laboratoires. L'utilisation de la biologie synthétique, des nano-molécules avec des propriétés d'auto-assemblage et des antigènes, des travaux de Lego sur les protéines, des vaccins basés sur des schémas génétiques avec des informations sur les molécules ADN-ARN, des vaccins à ARN m, etc. sont annoncés comme des moyens de décomposer ces impasses avec des approches radicales de l'innovation moléculaire.

Il n'est donc pas difficile d'imaginer la force du soutien que la fraternité pharmaceutique et l'espace d'innovation moléculaire peuvent tirer de tels progrès. IBM semble travailler sur une zone de traitement Covid dans une étude aux États-Unis relative à l'inhibiteur de la protéine de dopage du virus. Les résultats peuvent arriver bientôt et de nombreux autres laboratoires et blouses blanches dans le monde peuvent utiliser l'IA pour accélérer le vaccin et d'autres réponses d'une meilleure manière. À condition: l'IA peut apporter la vitesse qu'elle promet sans aucune erreur, aucun préjugé ou effet secondaire.

Rachel a peut-être bâclé un dessert et s'en est sorti, mais il faut en grande partie suivre la bonne recette et utiliser le bon ensemble d'ingrédients lorsqu'il s'agit de recettes de molécules aujourd'hui. Si vous êtes un robot, vous ne pouvez pas toujours compter sur un Ramsay ou une Monica pour veiller sur vos épaules. Tu ne devrais pas.

Pas quand l'horloge de Covid devient plus forte à chaque seconde.



Source link

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *