Наборы данных
Обучающие и тестовые данные для моделей машинного обучения
Информация о датасетах
На этой странице вы можете скачать исходные данные, использованные для обучения моделей KAN и MLP. Все данные представлены в формате CSV.
Описание файлов
| Файл | Описание | Использование | Примерное количество строк |
|---|---|---|---|
| train.csv | Обучающая выборка для моделей | Используется для обучения моделей KAN и MLP | ~90% от общего датасета |
| test.csv | Тестовая выборка для валидации | Используется для оценки качества моделей | ~10% от общего датасета |
| data.csv | Полный набор данных | Исходные данные перед разделением | Все доступные измерения |
Структура данных
Каждый CSV файл содержит следующие колонки:
orig_index, projectile_name, sample_name, ion_Z, ion_mass, target_Z, target_mass,
beam_energy_eV, temperature, angle, doi_source, target_melting_point,
target_boiling_point, target_evaporation_heat, target_heat_of_formation,
target_bulk_modulus, target_density, target_first_ion_en, target_work_function,
target_atomic_radius, target_covalent_radius_slater, target_vdw_radius,
ion_melting_point, ion_boiling_point, ion_evaporation_heat, ion_heat_of_formation,
ion_first_ion_en, ion_atomic_radius, ion_covalent_radius_slater, ion_vdw_radius,
experimental_value, pair
Важно:
Модели обучены на нормализованных данных. При использовании моделей с новыми данными убедитесь, что они приведены к тому же масштабу, что и обучающая выборка.
Источники данных и соответствие столбцам
Ниже указано, какие параметры берутся из библиотек и как они обозначены в data.csv и в библиотеках.
| Столбец data.csv | Описание | Источник (пример обозначения) |
|---|---|---|
ion_Z, target_Z |
Атомный номер | mendeleev.element.atomic_number; periodictable.elements.symbol.number; ase.data.atomic_numbers[symbol]; pymatgen.Element.Z |
ion_mass, target_mass |
Атомная масса (а.е.м.) | mendeleev.element.atomic_weight; periodictable.elements.symbol.mass; ase.data.atomic_masses[Z]; pymatgen.Element.atomic_mass |
target_melting_point, ion_melting_point |
Температура плавления (K) | mendeleev.element.melting_point; periodictable.elements.symbol.melting_point; pymatgen.Element.melting_point |
target_boiling_point, ion_boiling_point |
Температура кипения (K) | mendeleev.element.boiling_point; periodictable.elements.symbol.boiling_point; pymatgen.Element.boiling_point |
target_evaporation_heat, ion_evaporation_heat |
Теплота испарения (кДж/моль) | mendeleev.element.evaporation_heat |
target_heat_of_formation, ion_heat_of_formation |
Теплота образования (кДж/моль) | mendeleev.element.heat_of_formation |
target_bulk_modulus |
Модуль объёмного сжатия (ГПа) | mendeleev.element.bulk_modulus |
target_density |
Плотность (г/см³) | mendeleev.element.density; periodictable.elements.symbol.density; pymatgen.Element.density_of_solid |
target_first_ion_en, ion_first_ion_en |
Первая энергия ионизации (эВ) | mendeleev.element.ionenergies[1]; pymatgen.Element.first_ionization_energy |
target_work_function |
Работа выхода (эВ) | work_function.csv (target_work_function) |
target_atomic_radius, ion_atomic_radius |
Атомный радиус (пм) | mendeleev.element.atomic_radius; pymatgen.Element.atomic_radius |
target_covalent_radius_slater, ion_covalent_radius_slater |
Ковалентный радиус Слейтера (пм) | mendeleev.element.covalent_radius_slater; ase.data.covalent_radii |
target_vdw_radius, ion_vdw_radius |
Ван-дер-Ваальсов радиус (пм) | mendeleev.element.vdw_radius; ase.data.vdw_radii; pymatgen.Element.van_der_waals_radius |
Значения приводятся к единицам датасета: радиусы — в пикометрах, тепловые величины — в кДж/моль, плотность — в г/см³.