![]() 原标题:基于机器学习的低压铸造铝合金硬度预测研究 铝合金以其密度低、比强度高、耐腐蚀性能好和易加工等特点,在航空航天、汽车制造和通用机械等行业中应用广泛。在工业生产中,铝合金成分复杂,这会对其力学性能产生显著影响。在众多铸造工艺中,低压铸造凭借充型过程平稳、铸件组织致密以及成品率高等优势,日益受到重视,尤其适用于高品质、薄壁铝合金铸件的制造。硬度作为衡量铸件力学性能和使用可靠性的重要指标,除受铝合金化学成分影响外,还与熔炼温度、充型速度、保温时间及后续热处理制度等多种因素密切相关。然而,传统经验公式与简化模型在处理多维变量关系时表现不足,难以满足现代工业对硬度预测精度以及产品质量和生产效率的高要求。 近年来,随着人工智能和数据科学的迅猛发展,机器学习技术在材料设计、性能预测和材料基因工程等领域的应用逐渐兴起。通过数据驱动的建模方法,利用大量试验数据与先进算法(如随机森林、梯度提升树和支持向量机等),可以深入挖掘多维特征与目标性能之间的复杂映射关系,大幅提升预测精度并加速研发进程。这种方法不仅能够揭示材料性能与影响因素之间的潜在规律,也能为高效筛选新材料配方和工艺参数优化提供科学依据。 Al-Si合金以其优异的铸造成形性和良好的耐腐蚀性,被广泛应用于新能源汽车零部件。然而,Al-Si 合金种类多样、合金元素复杂,各元素之间的交互作用也相当复杂。在大批量生产中,炉前分析是保证产品质量的重要环节,通常需要多次取样、进行硬度检测和质量检测,这会耗费大量人力物力。当前急需一种基于数据驱动的检验技术,借助成分与性能之间的快速预测方法,以进一步提升生产效率和产品品质,具有重要的实践意义。有研究者利用 Bayesian 采样主动学习模型对6061铝合金的标准成分范围进行了精细优化,结合高通量试验与主动学习方法,通过构建包含复合性质特征的机器学习模型并应用SHAP与部分依赖图(PDP)等解释工具,深入揭示了Mg、Si、Cu 等关键微量元素对合金硬度的定量影响,其硬度(HV)预测误差仅为 4.49(7.23%),显著优于传统经验采样方法,充分说明了“主动学习+高通量试验”在优化合金成分与性能调控方面的优势。然而,该类研究往往聚焦于单一合金体系(如6061)及其标准成分范围,尚不足以应对工业生产中多牌号、成分多样化的需求。 基于此,本研究共收集3 418条低压铸造铝合金试验数据,样本均取自实际生产过程中炉前未经热处理的铸态合金,主要涵盖铸造铝合金中的3xxx系(Al-Si-Cu系)和4xxx系(Al-Si系),包括常见的A360、A380、ADC12、ADC1、GDL01、AlSi12Fe、AlSi8和AlSi10MnMg等合金牌号。在此基础上,综合考虑合金成分为输入变量,并结合硬度检测结果,构建并评估多种机器学习模型对铝合金硬度的预测能力。与以往仅分析特定元素或使用有限样本的研究相比,本研究基于大量试验数据,为深入探讨铝合金硬度的关键影响因素及其预测规律,引入Stacking算法与传统模型进行性能对比,以验证其显著优势并提高预测精度,旨在为铸造理论和工艺设计提供新的研究视角以及优化工艺参数、改进合金配方及工程实践提供参考。 图文结果 基于3 418条不同系列的低压铸造Al-Si合金试样的数据,数据包括元素质量分数、硬度等指标。所有试样均采自机边炉,其数据均直接来源于工厂的生产记录。图1为各铝合金牌号样本数量分布图和主要合金元素的箱线图。光谱测量的元素质量分数均在合金铸态时进行测定。合金元素成分和相应硬度测试结果见表1,合金元素成分和硬度见表2。
图1 各铝合金牌号样本数量分布图和主要合金元素的箱线图 表1 低压铸造铝合金数据集
表2 铝合金成分范围
将3 418条合金样本数据随机划分为训练集和临时集,其中训练集占70%(约2 392条),用于模型的训练;临时集占30%(约1 026条),用于模型参数调优与性能评估。随后,将临时集进一步均匀划分为验证集和测试集,各占15%(约513条)。其中验证集用于超参数优化及模型选择,测试集则专门用于最终评估模型的泛化能力和预测精度。这种两阶段的数据划分方法确保了验证集和测试集与训练数据严格独立,从而避免数据泄漏,客观且准确地评价模型的性能。为消除特征尺度差异对模型性能的影响,在模型训练之前,使用Sklearn中的StandardScaler对所有合金元素特征进行标准化处理。随机种子设置为42,以便数据的复现。通过超参数网格搜索进一步优化Stacking模型的最佳参数,以便模型充分学习数据分布特征并提升收敛速度与预测精度。 为预测低压铸造铝合金硬度与成分间的非线性映射关系,选取了多种机器学习算法并进行集成学习。首先,以元素质量分数为输入变量,硬度值为输出变量,分别构建了Lasso回归、支持向量回归(SVR)、K近邻回归(KNN)、梯度提升回归(GBR)及XGBoost等基学习器。过绘制真实值(True values)与预测值(Predictions)的散点图,展示模型预测性能的直观对比。使用SHAP图通过模型解释了不同输入特征对硬度预测的贡献,提供了模型预测机制的详细解读。采用皮尔逊相关系数热图,显示了输入特征之间的线性相关关系,通过颜色深浅和数值直观反映特征间的相似性。 采用了6种机器学习算法,包括Lasso回归、支持向量机(SVR)、K-近邻回归(KNN)、梯度提升回归(Gradient Boosting)、XGBoost和基于集成学习的Stacking模型,以及平均绝对误差(EMA)和决定系数(R2)两个评价指标进行展示与分析。图2为6种模型的测试集结果。
图2 6种模型测试集结果对比 图3为6种模型的R2和EMA对比图。可以看出,Stacking模型在硬度值预测任务中表现最佳,其EMA为3.055 0,显著低于其他模型,决定系数(R2)达到0.840 9,说明其拟合能力和预测精度均优于其他单一模型。相比之下,线性模型(如 Lasso 和 KNN)的表现较为一般,而XGBoost在单一模型中表现出较高的准确性,但仍略逊于Stacking模型。这表明Stacking模型通过整合多个基学习器,显著提升了预测性能,是硬度值预测任务的最优选择。
图3 6种模型的R2和EMA对比图 选取XGBoost模型进行SHAP分析和特征相关性热图分析,主要原因在于其性能优异且解释性强。作为表现仅次于Stacking模型的基学习器,XGBoost在多项性能指标(如R2和EMA)上表现突出,同时其基于梯度提升树的结构与SHAP方法高度契合,使得特征贡献的计算更加直观且高效。相比复杂的 Stacking 模型,XGBoost的单模型特性使其更适合用于解释性分析,能清晰展现每个特征对模型预测的影响。通过对XGBoost的分析,不仅能评估模型的预测能力,还能揭示影响预测结果的关键特征及其作用方向。 图4为XGBoost模型SHAP值分布散点图和特征相关性热图。SHAP分布散点图通过点的分布及颜色直观反映了各特征对铝合金硬度预测的贡献。SHAP值越大,特征对预测结果的影响越显著。
图4 XGBoost模型SHAP值分布散点图和特征相关性热图 结论 (1)采用了实际生产中3 418个低压铸造铝合金试样元素作为输入特征,硬度值作为目标变量,构建了多种机器学习模型,结果显示Stacking模型的综合性能最佳,其R2达到0.840 9,显著优于单一模型;同时,其EMA最低,表明其在捕捉数据特征的非线性关系和提升预测精度方面具有显著优势。 (2)在基于XGBoost的SHAP分析中,Cu对硬度值的预测贡献最为显著,凸显其在预测结果中的主导地位。特征重要性分析同样验证了Cu在硬度预测中的关键作用,两种方法的结论高度一致,进一步体现了模型的可靠性。从SHAP值重要性排序来看,Cu>Al>Zn>Si>Mg>Pb>Mn>Ca>Ni>Sn>Ti>Cr>Fe;相关系数热图也表明Cu与硬度值呈现显著相关性。综合分析表明,这些元素的组合及相互作用对硬度具有重要影响,为合金的设计与优化提供了可靠的数据支撑。 《基于机器学习的低压铸造铝合金硬度预测研究》
周云玄1 王朦朦1 张志刚2 于晓丹3 蔡东廷4 王俊5 汪东红6 刘琪1 本文转载自:《特种铸造及有色合金》 |