Aprendizaje automático en química: un curso introductorio de aprendizaje automático práctico y centrado en datos para estudiantes de pregrado 1. Este curso innovador, Aprendizaje automático en química (MLChem), está diseñado específicamente para estudiantes de pregrado, cerrando la brecha entre la educación química tradicional y las técnicas modernas de aprendizaje automático. Introduce algoritmos fundamentales de ML utilizando conjuntos de datos químicos auténticos, lo que garantiza una relevancia inmediata para el campo. 2. MLChem progresa desde algoritmos básicos de ML como agrupación y regresión hasta arquitecturas avanzadas de redes neuronales, incluidas CNN, GNN y RNN. El curso también cubre temas de vanguardia como el aprendizaje por refuerzo para la retrosíntesis y los campos de fuerza basados en IA, proporcionando a los estudiantes tanto conocimientos fundamentales como exposición a aplicaciones de frontera. 3. Una característica clave de MLChem es su enfoque práctico. Los estudiantes trabajan con conjuntos de datos químicos reales, como el conjunto de datos de solubilidad de moléculas pequeñas y el conjunto de datos de actividad peptídica, para desarrollar habilidades prácticas en caracterización molecular, reducción de dimensionalidad y predicción de propiedades. Las tareas se basan en desafíos inspirados en la investigación, preparando a los estudiantes para aplicaciones en el mundo real. 4. El curso enfatiza la importancia de la representación molecular, presentando a los estudiantes varias formas en que se pueden codificar las moléculas, como coordenadas 3D, estructuras gráficas y cadenas SMILES. Este conocimiento fundamental ayuda a los estudiantes a comprender cómo las diferentes representaciones influyen en los resultados del modelo en química. 5. MLChem también incluye conferencias sobre aplicaciones avanzadas, como el uso de Transformers para el modelado del lenguaje químico y el ajuste fino de los modelos de lenguaje de proteínas. Estos temas demuestran cómo los conceptos fundamentales de ML se conectan con los avances científicos de vanguardia en química. 6. Los materiales del curso, incluidos los cuadernos de Jupyter y las tareas, están disponibles públicamente a través del sitio web del curso. Este acceso abierto permite a los estudiantes y educadores de todo el mundo beneficiarse de los recursos y adaptarlos a sus propias necesidades de aprendizaje y enseñanza. 📜Papel: #MachineLearning #Chemistry #Education #Undergraduate #DataScience #NeuralNetworks #Research