文献精读
Appl.SoftComput.:超高性能混凝土(UHPC)流动性能、力学性能和孔隙率预测的自调优学习框架
背景介绍
超高性能混凝土(UHPC)是一类高性能纤维增强水泥基复合材料,具有自密实性、高力学性能和长期耐久性。UHPC在28天时的抗压强度高于MPa,并且在开裂后能够承受持续或更高的拉力。UHPC的优异性能是通过复杂的颗粒堆积密实度设计实现的,通过最大化颗粒堆积密实度,可实现精细的微观结构和低渗透性。为了实现高颗粒堆积密实度,UHPC的水胶比非常低(通常低于0.25)。短切纤维分散在UHPC中,通过对裂纹的桥接作用来提高其抗裂性和抗拉强度。鉴于其高强度和耐久性,UHPC已应用于工程结构的维修和施工。目前,UHPC混合料是在通过密集试验对不同混合料设计变量的影响进行综合研究的基础上开发的。实验测试有助于提供混合物设计变量和材料性能之间的可靠关系,但在人力和时间方面成本高昂。
研究出发点
机器学习方法有望预测混凝土的关键性能,加快高性能混凝土的设计,但现有方法在准确性和泛化性能方面存在局限性,因为用于训练预测模型的数据集有限且含有异常数据。
全文速览
美国史蒂文斯理工学院SoroushMahjoubi课题组提出了一个自动调整学习框架,用于预测UHPC的抗压强度、抗折强度、和易性和孔隙率。该框架有三个特点:(1)结构化和非结构化数据相结合;(2)采用基于隔离林、互信息和单变量线性回归相结合的无监督异常检测方法,识别和去除数据集中的异常和不适当变量;(3)机器学习模型的超参数采用带k-折叠交叉验证的树结构Parzen估计器进行优化。将所提出的学习框架与光梯度增强机(LightGBM)相结合,建立了自动调谐预测模型。结果表明,该方法具有较高的预测精度,自动调优模型可用于研究混合料设计变量对性能的影响。相关论文以“Auto-tunelearningframeworkforpredictionofflowability,mechanicalproperties,andporosityofultra-high-performanceconcrete(UHPC)”为题,于年发表在AppliedSoftComputing上。
图文解析
(1)数据收集
本研究从UHPC实验测试文献中收集了组数据,用于预测抗压强度、弯曲强度、流动性能和孔隙度,数据库共具有24个混合料设计变量,可分为四类:(1)胶凝系统变量,(2)增强纤维变量,(3)养护时间,(4)试样尺寸。
当变量相互关联时,会出现多重共线性,并可能误导对变量影响的解释。当皮尔逊相关系数R的绝对值高于0.7时,就会出现多重共线性。图1绘制了本研究中24个设计变量的R值的相关矩阵。
图1预测(a)抗压强度,(b)抗折强度,(c)流动性能和(d)孔隙度的变量的相关矩阵
根据图1,用于预测抗压强度、抗弯强度、流动性能和孔隙度的数据集的皮尔逊相关系数的最大绝对值分别等于0.68、0.66、0.67和0.65,均小于0.7,表明不存在多重共线性。因此,使用数据集开发机器学习模型是合适的。
(2)机器学习方法的初步选择和超参数优化
选择了五种RMSE40且R0.18的抗压强度预测机器学习方法,即极端随机化树、随机森林、XGBoost、CatBoost和LightGBM。使用树结构的Parzen估计器优化了五个选定机器学习模型的超参数。
表1列出了五种选定方法的性能指标,基于LightGBM的方法显示出最好的预测性能,因此选择它进行进一步的研究。采用同样的方法,对UHPC的弯曲强度、流动性能和孔隙率进行了超参数优化。优化结果表明,对于不同的UHPC材料性能,超参数的最优值存在很大差异。这些结果解释了超参数优化对机器学习模型至关重要的原因。因此,机器学习模型针对不同的性质采用不同的最优超参数。
表1所选方法的性能指标(最佳算法用粗体书写)
(3)异常检测和变量选择
图2显示了污染率对自动调谐LightGBM预测误差的影响。RMSE使用每个属性的最大RMSE进行归一化,并指定为归一化均方根误差(NRMSE)。抗压强度、弯曲强度、流动性能和孔隙度模型的最大RMSE值分别为27.3MPa、7.2MPa、3.4%和9.9%。随着污染率从0增加到50%,总体而言,NRMSE值增加,但当污染率为零时,无法达到最小NRMSE,因为当污染率为零时,通过删除许多被视为异常的数据,数据集规模显著减小。与抗压强度、弯曲强度、流动性能和孔隙率的最小NRMSE相对应的污染率分别为7.6%、10.5%、1.6%和19.9%。当进行异常检测时,抗压强度、弯曲强度、流动性能和孔隙度模型的NRMSE值分别降低了20%、22%、30%和51%,表明所提出的异常检测方法是有效的。
图2污染率对以下预测误差的影响:(a)抗压强度,(b)弯曲强度,(c)流动性能,(d)孔隙度模型
图3显示了变量的互信息和单变量线性回归的结果。互信息和F统计量的大小反映了输入变量和输出变量之间的关联程度。互信息量或F-static值高表明相关性高。例如,养护时间的变量22显示了最大程度的互信息(0.6)和F-static(80),这意味着养护时间对抗压强度的影响最大。这24个变量按照相关度顺序排列。该序列为进一步分析设计变量的选择提供了指南,因为排名靠前的变量对预测性能有很大影响。
根据确定的变量序列,测试变量数量对RMSE的影响,如图4所示。为了平衡计算成本和精度,训练自动调谐LightGBM的次数固定为。对于每个属性,与最小误差相对应的设计变量数量是设计变量的最佳数量。根据图4,抗压强度、抗弯强度、流动性能和孔隙率的设计变量分别为17、21、12和16。抗压强度数据集排除变量8、13、16、17、18、20和21。抗弯强度数据集排除变量17、18和24。流动性能数据集排除变量3、4、6、8、11、13、16、17和18。孔隙度数据集排除变量3、6、16和21。
图3UHPC设计变量的互信息(MI)和F统计值:(a)抗压强度,(b)弯曲强度,(c)流动性能,(d)孔隙度
图4所选变量的数量对以下预测误差的影响:(a)抗压强度,(b)弯曲强度,(c)流动性能,(d)孔隙度
(4)UHPC性能预测结果
图5将UHPC的抗压强度、弯曲强度、流动性能和孔隙率的预测结果与实验数据进行了比较。总体而言,这四种机器学习模型在训练和测试中都达到了合理的预测精度,UHPC流动性能的最小R2值为0.90。
图5预测结果与实验结果的对比:(a)抗压强度,(b)弯曲强度,(c)流动性能(d)孔隙率
(5)混合物设计变量的影响
设计变量的重要性如图6所示。高变量重要性分数表明设计变量对预测属性的影响更大。例如,变量1、22、14、15和10(即水泥含量、养护时间、含水量、高效减水剂含量和砂含量)是UHPC抗压强度的最重要变量;变量1、14、19和10(即水泥含量、水含量、钢纤维含量和砂含量)是流动性能的最重要变量。
图6混合料设计变量的变量重要性:白色块是排除的变量,绿色块是最初未考虑的变量
应注意,图3、图6中的结果基于设计变量的不同评分方法。使用互信息和单变量线性回归测试对图3中的变量选择进行评分,同时使用图6中开发的预测模型对变量进行评分,以评估变量的重要性。变量选择方法根据建立的数据集和相关分析方法获得的结果对设计变量进行评分,而变量重要性则利用训练模型的预测误差来量化设计变量的重要性。
利用试验数据对预测模型进行了进一步评估,以证明所开发的模型能够评估设计变量对UHPC新拌和硬化性能的影响。
为了验证抗压强度模型,将试验数据与预测结果进行比较。图7-10显示,该模型可以预测抗压强度,试验结果与抗压强度预测结果的最大绝对误差小于10MPa;该模型可以预测弯曲强度,预测的最大绝对误差小于3MPa;该模型可以预测坍落扩展度的影响,预测的最大绝对误差为11毫米;该模型可以预测孔隙度,预测的最大绝对误差为1.7%。
图7不同变量对UHPC抗压强度的影响:(a)养护时间,(b)水灰比,(c)钢纤维含量
图8不同变量对UHPC弯曲强度的影响:(a)养护时间和,(b)钢纤维含量
图9钢纤维含量对UHPC流动性能的影响
图10不同变量对UHPC孔隙率的影响:(a)养护时间,(b)水灰比
总结
本文提出了一种新的机器学习框架,用于预测UHPC的抗压强度、抗弯强度、流动性能和孔隙率,具有较高的精度和泛化性能。通过比较15种数据驱动方法,选择LightGBM,并将其与自动超参数调优、k-折叠交叉验证、异常检测和混合变量选择相结合,以预测UHPC的特性。得出以下结论:
(1)所提出的机器学习框架在预测UHPC的抗压强度、抗弯强度、流动性能和孔隙率方面具有较高的精度和泛化性能。R2值分别为0.99、0.95、0.90和0.99。
(2)用于训练机器学习模型的数据集的质量对预测精度起着重要作用。变量选择和异常检测方法提高了机器学习模型的预测精度。去除数据集中流动性能和孔隙度的异常数据后,D值分别从0.56增加到0.87,从0.65增加到0.96。为流动性能和孔隙度选择合适的变量,将R2值分别从0.56增加到0.89,从0.65增加到0.95。
(3)所提出的模型选择方法使用具有k倍交叉验证的树结构Parzen估计器,能够提高基于极端随机化树、随机森林、XGBoost、CatBoost和LightGBM的预测模型的预测精度。UHPC抗压强度的预测结果表明,采用所提出的模型选择方法可将LightGBM的F值从0.41增加到0.94。
(4)所提出的机器学习模型可用于研究不同混合料设计变量对UHPC抗压强度、弯曲强度、流动性能和孔隙率的影响。
本期编者简介
翻译:
程博远硕士生深圳大学
审核:
郑淑仪硕士生深圳大学
排版:
于坷坷硕士生深圳大学
本期学术指导
何闯博士后深圳大学
龙武剑教授深圳大学
文献链接:
转载请注明:http://www.0431gb208.com/sjslczl/299.html