Apprentissage automatique en chimie : un cours d'introduction pratique et centré sur les données pour les étudiants de premier cycle 1. Ce cours innovant, Apprentissage automatique en chimie (MLChem), est conçu spécifiquement pour les étudiants de premier cycle, comblant le fossé entre l'éducation chimique traditionnelle et les techniques modernes d'apprentissage automatique. Il introduit des algorithmes fondamentaux d'AA en utilisant des ensembles de données chimiques authentiques, garantissant une pertinence immédiate dans le domaine. 2. MLChem progresse des algorithmes d'AA de base comme le clustering et la régression aux architectures avancées de réseaux de neurones, y compris les CNN, GNN et RNN. Le cours couvre également des sujets de pointe tels que l'apprentissage par renforcement pour la rétrosynthèse et les champs de force basés sur l'IA, fournissant aux étudiants à la fois des connaissances fondamentales et une exposition aux applications de pointe. 3. Une caractéristique clé de MLChem est son approche pratique. Les étudiants travaillent avec de véritables ensembles de données chimiques, tels que l'ensemble de données de solubilité des petites molécules et l'ensemble de données d'activité des peptides, pour développer des compétences pratiques en caractérisation moléculaire, réduction de dimensionnalité et prédiction de propriétés. Les devoirs sont modélisés sur des défis inspirés de la recherche, préparant les étudiants aux applications du monde réel. 4. Le cours souligne l'importance de la représentation moléculaire, introduisant les étudiants à diverses manières dont les molécules peuvent être encodées, telles que les coordonnées 3D, les structures graphiques et les chaînes SMILES. Cette connaissance fondamentale aide les étudiants à comprendre comment différentes représentations influencent les résultats des modèles en chimie. 5. MLChem comprend également des cours sur des applications avancées, telles que l'utilisation de Transformers pour la modélisation du langage chimique et le fine-tuning des modèles de langage protéique. Ces sujets démontrent comment les concepts fondamentaux d'AA se connectent aux avancées scientifiques de pointe en chimie. 6. Les supports de cours, y compris les notebooks Jupyter et les devoirs, sont disponibles publiquement via le site web du cours. Cet accès ouvert permet aux étudiants et aux éducateurs du monde entier de bénéficier des ressources et de les adapter à leurs propres besoins d'apprentissage et d'enseignement. 📜Article : #MachineLearning #Chemistry #Education #Undergraduate #DataScience #NeuralNetworks #Research