1. Формат ввода
По ссылке доступен архив с фотоплетизмограммами, файл train.csv с обучающими данными (553 пациента) и файл test.csv – тестовые данные (142 пациента).
Фотоплетизмограммы представлены в виде одномерных массивов, сохраненных в формате *.npy. Длительность каждой фотоплетизмограммы составляет 27 секунд, частота дискретизации – 100 Гц, таким образом длина одного массива – 2700.
Файл train.csv содержит следующие колонки:
● ID – уникальный идентификатор пациента, которому соответствует файл с фотоплетизмограммой. Например, пациенту с ID "k31__1__1" соответствует файл "k31__1__1.npy";
● ЛПНП – истинное значение целевой бинарной переменной, где класс 1 – означает повышенный уровень ЛПНП (≥3 ммоль/л), а класс 0 – нормальный уровень ЛПНП (<3 ммоль/л).
Файл test.csv содержит аналогичные колонки, за исключением таргета – ЛПНП.
2. Формат вывода
Результатом решения данной задачи должен быть файл submit.csv с двумя колонками:
● ID – идентификатор пациента из test.csv.
● ЛПНП – вероятность принадлежности к классу 1 (повышенный уровень ЛПНП).
Например,
ID,ЛПНП
0007,0.05
0009,0.5513
0013,0.1513
…