Maschinenlernen in der Chemie: Ein datenzentrierter, praxisorientierter Einführungskurs zum Maschinenlernen für Studierende im Grundstudium 1. Dieser innovative Kurs, Maschinenlernen in der Chemie (MLChem), ist speziell für Studierende im Grundstudium konzipiert und überbrückt die Kluft zwischen traditioneller Chemieausbildung und modernen Maschinenlerntechniken. Er führt grundlegende ML-Algorithmen anhand authentischer chemischer Datensätze ein, was sofortige Relevanz für das Fachgebiet gewährleistet. 2. MLChem entwickelt sich von grundlegenden ML-Algorithmen wie Clustering und Regression zu fortgeschrittenen neuronalen Netzwerkarchitekturen, einschließlich CNNs, GNNs und RNNs. Der Kurs behandelt auch aktuelle Themen wie Reinforcement Learning für Retrosynthese und KI-basierte Kraftfelder, wodurch die Studierenden sowohl grundlegendes Wissen als auch Einblicke in neueste Anwendungen erhalten. 3. Ein zentrales Merkmal von MLChem ist der praxisorientierte Ansatz. Die Studierenden arbeiten mit realen chemischen Datensätzen, wie dem Datensatz zur Löslichkeit kleiner Moleküle und dem Datensatz zur Peptidaktivität, um praktische Fähigkeiten in der molekularen Merkmalsbildung, Dimensionsreduktion und Eigenschaftsvorhersage zu entwickeln. Die Aufgaben sind an forschungsinspirierten Herausforderungen orientiert und bereiten die Studierenden auf reale Anwendungen vor. 4. Der Kurs betont die Bedeutung der molekularen Darstellung und führt die Studierenden in verschiedene Möglichkeiten ein, wie Moleküle kodiert werden können, wie z.B. 3D-Koordinaten, Graphstrukturen und SMILES-Strings. Dieses grundlegende Wissen hilft den Studierenden zu verstehen, wie unterschiedliche Darstellungen die Modellergebnisse in der Chemie beeinflussen. 5. MLChem umfasst auch Vorlesungen über fortgeschrittene Anwendungen, wie die Verwendung von Transformern für chemisches Sprachmodellieren und das Feintuning von Protein-Sprachmodellen. Diese Themen zeigen, wie grundlegende ML-Konzepte mit modernsten wissenschaftlichen Fortschritten in der Chemie verbunden sind. 6. Die Kursmaterialien, einschließlich Jupyter-Notebooks und Hausaufgaben, sind über die Kurswebsite öffentlich zugänglich. Dieser offene Zugang ermöglicht es Studierenden und Lehrenden weltweit, von den Ressourcen zu profitieren und diese für ihre eigenen Lern- und Lehrbedürfnisse anzupassen. 📜Paper: #MachineLearning #Chemistry #Education #Undergraduate #DataScience #NeuralNetworks #Research