Это задача о применении машинного обучения к классической задаче вычислительной квантовой химии.
Вероятность встретить молекулу с конкретным трехмерным представлением (конформацией) зависит от потенциальной энергии согласно закону Больцмана, чем меньше энергия тем эта вероятность больше.
Требуется построить алгоритм, который по трехмерному представлению (конформации) молекулы будет предсказывать потенциальную энергию.
Описание молекулы содержит типы входящих в неё атомов и соответствующие им трехмерные координаты.
Решение данной задачи поможет ускорить и масштабировать квантово-химические расчёты и упростить задачу поиска медицинских препаратов.
Для решения задачи участникам будет предложен обучающий датасет в формате базы данных ASE database, содержащей ~200 тысяч записей. В качестве решения нужно получить значения целевой переменной (энергии молекулярной конформации) для тестовой части датасета. Качество решений будут оцениваться с помощью MAE (Средней абсолютной ошибки). Конкурс будет проходить на платформе kaggle.