Наборы данных

Обучающие и тестовые данные для моделей машинного обучения

3 файла
Информация о датасетах

На этой странице вы можете скачать исходные данные, использованные для обучения моделей KAN и MLP. Все данные представлены в формате CSV.

data.csv

Доступен

966 строк

32 колонок

283.7 КБ

train.csv

Доступен

870 строк

32 колонок

255.5 КБ

test.csv

Доступен

96 строк

32 колонок

29.9 КБ

Описание файлов

Файл Описание Использование Примерное количество строк
train.csv Обучающая выборка для моделей Используется для обучения моделей KAN и MLP ~90% от общего датасета
test.csv Тестовая выборка для валидации Используется для оценки качества моделей ~10% от общего датасета
data.csv Полный набор данных Исходные данные перед разделением Все доступные измерения

Структура данных

Каждый CSV файл содержит следующие колонки:

orig_index, projectile_name, sample_name, ion_Z, ion_mass, target_Z, target_mass, 
beam_energy_eV, temperature, angle, doi_source, target_melting_point, 
target_boiling_point, target_evaporation_heat, target_heat_of_formation, 
target_bulk_modulus, target_density, target_first_ion_en, target_work_function, 
target_atomic_radius, target_covalent_radius_slater, target_vdw_radius, 
ion_melting_point, ion_boiling_point, ion_evaporation_heat, ion_heat_of_formation, 
ion_first_ion_en, ion_atomic_radius, ion_covalent_radius_slater, ion_vdw_radius, 
experimental_value, pair
Важно:

Модели обучены на нормализованных данных. При использовании моделей с новыми данными убедитесь, что они приведены к тому же масштабу, что и обучающая выборка.

Источники данных и соответствие столбцам

Ниже указано, какие параметры берутся из библиотек и как они обозначены в data.csv и в библиотеках.

Столбец data.csv Описание Источник (пример обозначения)
ion_Z, target_Z Атомный номер mendeleev.element.atomic_number; periodictable.elements.symbol.number; ase.data.atomic_numbers[symbol]; pymatgen.Element.Z
ion_mass, target_mass Атомная масса (а.е.м.) mendeleev.element.atomic_weight; periodictable.elements.symbol.mass; ase.data.atomic_masses[Z]; pymatgen.Element.atomic_mass
target_melting_point, ion_melting_point Температура плавления (K) mendeleev.element.melting_point; periodictable.elements.symbol.melting_point; pymatgen.Element.melting_point
target_boiling_point, ion_boiling_point Температура кипения (K) mendeleev.element.boiling_point; periodictable.elements.symbol.boiling_point; pymatgen.Element.boiling_point
target_evaporation_heat, ion_evaporation_heat Теплота испарения (кДж/моль) mendeleev.element.evaporation_heat
target_heat_of_formation, ion_heat_of_formation Теплота образования (кДж/моль) mendeleev.element.heat_of_formation
target_bulk_modulus Модуль объёмного сжатия (ГПа) mendeleev.element.bulk_modulus
target_density Плотность (г/см³) mendeleev.element.density; periodictable.elements.symbol.density; pymatgen.Element.density_of_solid
target_first_ion_en, ion_first_ion_en Первая энергия ионизации (эВ) mendeleev.element.ionenergies[1]; pymatgen.Element.first_ionization_energy
target_work_function Работа выхода (эВ) work_function.csv (target_work_function)
target_atomic_radius, ion_atomic_radius Атомный радиус (пм) mendeleev.element.atomic_radius; pymatgen.Element.atomic_radius
target_covalent_radius_slater, ion_covalent_radius_slater Ковалентный радиус Слейтера (пм) mendeleev.element.covalent_radius_slater; ase.data.covalent_radii
target_vdw_radius, ion_vdw_radius Ван-дер-Ваальсов радиус (пм) mendeleev.element.vdw_radius; ase.data.vdw_radii; pymatgen.Element.van_der_waals_radius
Значения приводятся к единицам датасета: радиусы — в пикометрах, тепловые величины — в кДж/моль, плотность — в г/см³.