Outlier detection algorithms for penetration depth data of concrete targets combined with prior knowledge
-
摘要: 为剔除混凝土侵彻深度试验数据异常点,提出了一种融合先验知识的异常检测算法。利用反向传播(back propagation, BP)神经网络模型拟合试验样本数据的分布,结合偏差指标筛选离群样本点,并通过经验算法评价模型异常检测性能。针对试验数据特点选择全量梯度下降结合动量优化方法,从而提高模型迭代训练的稳定性和效率,并且在构建模型过程中融合领域先验知识约束对样本数据的拟合,使得模型在训练过程中能反映附加特征的影响。结果表明,BP神经网络模型适合于刚性弹对混凝土侵彻试验数据异常点的检测,加入合理的领域先验知识可有效提高模型的检测精度。Abstract: Data quality is the basis for the validity and accuracy of data-driven models, and there may be a large number of anomalies in the raw concrete targets penetration depth data. Therefore, to ensure the accuracy of the subsequent data-driven model, it is necessary to eliminate the outlier of the raw data. Compared with the traditional anomaly detection method, the anomaly detection method based on neural network models is more suitable for complex multi-dimensional and unevenly distributed concrete target penetration depth data. However, relying only on the neural network model to fit the raw experimental data ignores the abundant and effective expert prior knowledge, which will reduce the accuracy of the model, and even lead to wrong prediction results due to the limited amount of data of the training sample, data bad pixels, poor data distribution, etc. To this end, an algorithm for outlier detection of concrete target penetration depth data combined with prior knowledge was proposed. Firstly, the back propagation (BP) neural network model is used to fit the distribution of the experiment samples, then the outlier is screened out based on the deviation index, and at last, the anomaly detection performance of the model is evaluated by the empirical algorithm. Based on the characteristics of the experimental data, the batch gradient descent combined with the momentum optimization method is selected to improve the stability and efficiency during training. Furthermore, by adding domain prior knowledge with the BP neural network model to constrain the fitting of the sample data, the model can reflect the influence of additional features during training. The research results show that the BP neural network model is suitable for the outlier detection of the rigid projectile penetrating concrete experiment data. The fusion of reasonable prior knowledge can improve the detection accuracy and the convergence speed of the model, furthermore, integrating different prior knowledge will cause different results.
-
Key words:
- concrete penetration /
- neural network /
- prior knowledge /
- anomaly detection
-
在爆炸载荷的作用下,容器壳体的最大应变没有出现在第一个应变峰上,而是出现在后期的应变峰上的现象被称为爆炸容器的应变增长现象[1]。应变增长现象中出现意料之外的应变量,会对容器安全形成威胁。自1976年被发现以来[2],应变增长现象引起了广泛关注,其形成原因可以归纳为两种:不同振动模态的叠加[1~6]以及爆炸载荷与壳体振动共振[7]。到目前为止,涉及应变增长现象的研究几乎都是在壳体弹性变形范围内。针对实验中发现的球壳塑性变形时的应变增长现象,本文中将分析该现象形成的原因以及相关规律。
1. 实验研究及结果
在球形容器中开展爆炸加载实验。容器内径为523 mm,壁厚为3 mm,壳体材料为Q345R,其静态屈服强度不低于345 MPa。球壳由两个半球焊接而成。容器顶部有内径125 mm的开孔,用于安装炸药。容器赤道面(即两个半球的焊缝面)上均布4个小开孔,用于安装压力传感器。实验采用球形装药,由细尼龙绳吊挂于容器中心。装药采用较严格的中心点起爆方式,由雷管(处于球壳上部的雷管腔内,与球壳内部空间隔开)引爆较细的柔爆索,柔爆索在中心起爆微型药球(直径10 mm,由微米级的PETN粉压制而成),微型药球再起爆球形主装药(由60%RDX和40%TNT浇铸而成),以形成较理想的球面冲击波。球形容器照片见图 1。容器外壁粘贴三向应变片,应变片的位置和方向见图 2。
爆炸当量370 g TNT时球壳的应变数据见表 1。从表 1中可见,球壳应变的第一峰基本上都超过1%,远超过壳体的屈服应变。壳体材料动态屈服强度σy按620 MPa计算,参考下式:
εy=σy(1−ν)E (1) 表 1 球壳应变数据Table 1. Experimental strain of spherical shell应变片位置 方向 第一个应变峰/10-3 最大应变值/10-3 最大值应变值所处峰的位置 应变增长系数 实测值 平均值 S1 1 10.804 11.081±2.5% 10.804 1 1.00 2 10.804 12.606 2 1.16 3 11.635 13.063 2 1.12 S2 1 10.802 10.262±6.6% 12.057 2 1.11 2 10.397 12.057 2 1.15 3 9.588 10.802 2 1.12 S3 1* 11.945 11.225±6.4% 12.197 2 1.02 (12.456) (3) 2 10.808 11.610 2 1.07 3 10.922 11.485 2 1.05 S4 1 9.140 9.883±7.5% 9.140 1 1.00 2 10.197 10.503 2 1.03 3 10.312 10.503 2 1.01 S5 1 11.821 13.159±14.3% 11.821 1 1.00 2 15.036 - - - 3 12.619 12.989 2 1.02 S6 1 13.866 13.762±4.3% 15.211 2 1.09 2 14.254 16.427 2 1.15 3 13.167 14.571 2 1.10 注:标注*的数据出现特殊情况,其第二个应变峰虽大于第一个应变峰,但应变最大值出现在第三个应变峰上。 式中:泊松比ν=0.3,弹性模量E=200 GPa,可估算屈服应变εy=2.170×10-3。图 3为球壳应变的典型曲线,壳体残余应变也超过了1%。
从图 3中还可以看出,应变最大值出现在应变曲线的第二个峰上,应变曲线出现了应变增长现象。由表 1数据可知,实验获得的有效应变数据为17组,其中14组出现了应变增长现象,13组出现了应变最大值出现在第二个应变峰上的情况,与图 3的应变曲线的特征一样。表 1中数据显示,应变增长系数最大达到1.16。
2. 分析和讨论
对于振动叠加形成的应变增长现象,一般认为,弯曲波产生于扰动源(指容器上的开孔、法兰等)并传播至壳体某位置,与其他的壳体振动叠加形成应变增长现象[4-5]。由于弯曲波存在传播过程,在该应变增长现象中,不同位置球壳的应变增长现象的特征是不同的,比如应变最大值出现的时间存在差异。在本次实验出现的应变增长现象中,应变最大值均出现在第二个应变峰上,特征相同,因此其不是振动叠加形成的应变增长现象,而可能是由爆炸载荷与球壳振动共振引起的。
图 4为实验测得的球壳内壁压力-时间曲线,曲线上周期性地出现了3个脉冲,脉冲之后容器内的压力基本趋于平静。Duffey数值模拟研究[7]表明,炸药产生的冲击波直接作用在球壳内壁形成第一个脉冲,之后冲击波返回球壳中心并反射回来再次作用在球壳内壁,形成第二个脉冲,如此反复不断产生周期性的脉冲。本次实验对应的比距离约为0.36 m/kg1/3,冲击波来回过程仅持续了3次,之后冲击波衰减至可以忽略。在当量更大、容器半径更小的情况下,冲击波更强,脉冲的数目可能大于3个。
借助一维球壳响应理论[8],可以由容器内壁压力-时间曲线分析出壳体响应情况。因为一维球壳除了呼吸振动外无其他振动,因此一维球壳出现的应变增长现象必定由爆炸载荷引起。
一维球壳响应理论存在以下前提或假设:壳体材料密度变化忽略不计,即壳体材料不可压缩;球壳为薄壁,即截面上应力近似认为是均匀分布,意味着球壳半径r远大于壁厚h。
参考文献[8],假设球壳半径变化不大,壁厚不变,根据牛顿定律建立平衡方程:
h(σθ+σφ)+ρ hrd2urdt2=rp(t) (2) 式中:ρ为壳体材料密度,E为弹性模量,p(t)为容器内壁压力历程,ur为球壳径向位移,σθ、σφ为球壳的主应力。由于球壳为点对称模型,则
σθ=σφ=σ (3) 根据Hook定律,在壳体材料弹性变形范围内,存在关系式
σ=E1−ν ε=E1−νurr (4) 把式(3)、(4)代入式(2),得到
d2urdt2+ω2ur=p(t)ρ h (5) 其中
ω2=2Eρr2(1−ν) (6) 设球壳材料的应力应变曲线关系为双线性弹塑性本构关系,壳体发生塑性变形时:
σ=σy+Es(ε−εy) (7) 式中:σy和εy分别为容器材料屈服强度及屈服应变,ES为强化模量。把式(7)代入式(2),得到球壳塑性变形时的平衡方程:
d2urdt2+ωp2ur=p(t)ρ h−2(σy−ESεy)ρ r (8) 其中
ω2p=2ESρ r2 (9) 球壳弹性响应方程(5)和塑性响应方程(8)忽略了球壳半径和厚度的变化。考虑厚度的变化将更符合现实情况,变化的容器半径与厚度关系为:
hr2=h0r20 (10) 借助数学软件Matlab求解以上式子。
输入实测的球壳内壁压力-时间曲线(见图 4),计算出球壳响应曲线,见图 5。爆炸加载下壳体材料的动态屈服强度很难直接给出准确值,材料动态拉伸试验显示其屈服强度大部分在600~700 MPa之间,为了对比由压力曲线计算得到的应变曲线与真实应变曲线的特征,计算过程中壳体材料屈服强度取数值620 MPa(前文的620 MPa也来源于此),以使得计算的应变曲线的第一个应变峰与实验应变曲线的第一个应变峰相等。
图 5比较了计算得到的球壳应变曲线和实验获得的应变曲线,计算的应变曲线与实验应变曲线的特征相似,出现了应变增长现象,且应变最大值出现在第二个应变峰上。由此可以判断,实验中应变增长现象由容器内壁的周期性多脉冲载荷引起。图 5还可以对比球壳响应曲线和球壳内壁压力-时间历程曲线的时间特征,可见仅前两个脉冲对应变增长现象有贡献。
从响应方程(5)和(8)来看,第一个脉冲作用下壳体获得变形动力,且在内部应力和惯性力共同作用下进行振动。很显然,后续如出现第二个脉冲,且作用方向与壳体运动方向相同,将推动壳体变形在原变形基础上进一步增加,出现应变增长现象;相反,后续脉冲作用方向与壳体运动方向相反,会对壳体运动造成一定阻碍,导致壳体变形减少,不出现应变增长现象。从图 5可见,第二个脉冲持续的时间较长,要大于壳体振动的半个周期,脉冲的一部分作用方向与壳体运动方向相同,另一部分必定与壳体运动方向相反。必须注意,从压力衰减规律来看,脉冲的主要部分处于脉冲的前期。
以球壳内壁压力-时间曲线(见图 4)为基础,人为设置第二个脉冲出现时刻不同的8种载荷,并计算得到相应的球壳响应情况,如图 6所示。以此分析第二个脉冲作用方向与壳体运动方向出现不同状况时的应变增长现象。
可见,第二个脉冲出现时刻在上一个应变峰的下降沿前段,脉冲的主要部分作用在该应变峰的下降沿,作用方向与壳体运动方向相反,导致下一个应变峰减少,无应变增长现象,如图 6(a)~(c);第二个脉冲出现时刻在上一个应变峰的下降沿后段,脉冲的小部分作用在该应变峰的下降沿,大部分作用在当前应变峰的上升沿,导致当前应变峰大于上一个应变峰,出现应变增长现象,如图 6(d);第二个脉冲的出现时刻在当前应变峰的上升沿,必然导致当前应变峰大于上一个应变峰,出现应变增长现象,如图 6(e)~(h),其中以第二个脉冲出现在当前应变峰的上升沿前段时的应变增长现象最严重,如图 6(e)~(f)。综上所述,后续脉冲的出现时刻决定应变增长现象的有无和强弱,本文实验中的第二个脉冲出现在应变峰的上升沿前段(见图 5),由此引起比较严重的应变增长现象。
4. 结论
(1) 实验观察到球壳塑性变形量超过1%时的应变增长现象,应变增长系数最大为1.16。
(2) 实验中应变增长现象是由球壳内壁周期性多脉冲载荷引起的,球壳内壁载荷存在3个较明显的脉冲,仅前两个脉冲对应变增长现象有贡献。
(3) 第二个脉冲的出现时刻决定应变增长现象的有无和强弱,实验中的第二个脉冲出现在应变峰的上升沿前段,引起较严重的应变增长现象。
-
表 1 试验数据示例
Table 1. Examples of experimental data
d/m m/kg v/(m·s−1) fc/MPa N* x/d 0.01292 0.064 371 13.8 1 9.83 0.0762 5.9 308 35.1 3 3.04 0.305 191.62 79 39.0 2 0.098 0.01292 0.064 1142 13.8 0 65.79 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 表 2 各速度区间数据分布
Table 2. Data distribution in each velocity range
速度区间/(m·s−1) 样本数/个 速度区间/(m·s−1) 样本数/个 [0, 400] 379 (800, 1200] 117 (400, 800] 542 (1200, 1700] 40 表 3 各质量区间数据分布
Table 3. Data distribution in each mass range
质量区间/kg 样本数/个 质量区间/kg 样本数/个 [0, 50] 991 (100, 500] 56 (50, 100] 31 表 4 异常数据示例
Table 4. Examples of outlier data
数据编号 d/m m/kg v/(m·s−1) fc/MPa N* x/d 备注 306 0.0127 0.0587 399 29.2 0 9.40 307 0.0127 0.0587 334.9 29.2 0 11.19 异常数据 308 0.0127 0.0587 453.8 29.2 0 11.04 569 0.05 4.5 417 135 2 9.9 571 0.05 4.5 460 135 2 11.2 573 0.05 4.5 456 135 2 10.8 577 0.05 4.5 456 135 2 5 异常数据 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 表 5 模型异常检测性能对比
Table 5. Comparison of the outlier detection performances of the models
模型 样本总数 模型剔除异常样本点数 经验算法评判异常样本点数 准确率 无融合先验知识 1078 128 87 0.6796 融合单先验参数 1078 113 78 0.6903 融合双先验参数 1078 115 86 0.7478 融合三先验参数 1078 112 82 0.7321 -
[1] 张磊, 吴昊, 赵强, 等. 基于数据挖掘技术的地下工程目标毁伤效应计算方法 [J]. 爆炸与冲击, 2021, 41(3): 031101. DOI: 10.11883/bzycj-2020-0114.ZHANG L, WU H, ZHAO Q, et al. Calculation method of damage effects of underground engineering objectives based on data mining technology [J]. Explosion and Shock Waves, 2021, 41(3): 031101. DOI: 10.11883/bzycj-2020-0114. [2] LI Q L, WANG Y, SHAO Y D, et al. A comparative study on the most effective machine learning model for blast loading prediction: from GBDT to Transformer [J]. Engineering Structures, 2023, 276: 115310. DOI: 10.1016/j.engstruct.2022.115310. [3] ALMUSTAFA M K, NEHDI M L. Machine learning model for predicting structural response of RC slabs exposed to blast loading [J]. Engineering Structures, 2020, 221: 111109. DOI: 10.1016/j.engstruct.2020.111109. [4] ALMUSTAFA M K, NEHDI M L. Machine learning model for predicting structural response of RC columns subjected to blast loading [J]. International Journal of Impact Engineering, 2022, 162: 104145. DOI: 10.1016/j.ijimpeng.2021.104145. [5] ZHAO C F, ZHU Y F, ZHOU Z H. Machine learning-based approaches for predicting the dynamic response of RC slabs under blast loads [J]. Engineering Structures, 2022, 273: 115104. DOI: 10.1016/j.engstruct.2022.115104. [6] NETO L B, SALEH M, PICKERD V, et al. Rapid mechanical evaluation of quadrangular steel plates subjected to localised blast loadings [J]. International Journal of Impact Engineering, 2020, 137: 103461. DOI: 10.1016/j.ijimpeng.2019.103461. [7] WANG H Z, BAH M J, HAMMAD M. Progress in outlier detection techniques: a survey [J]. IEEE Access, 2019, 7: 107964–108000. DOI: 10.1109/ACCESS.2019.2932769. [8] PANG G S, SHEN C H, CAO L B, et al. Deep learning for anomaly detection: a review [J]. ACM Computing Surveys, 2021, 54(2): 38. DOI: 10.1145/3439950. [9] MURALIDHAR N, ISLAM M R, MARWAH M, et al. Incorporating prior domain knowledge into deep neural networks [C]//2018 IEEE International Conference on Big Data. Seattle: IEEE, 2018: 36–45. DOI: 10.1109/BigData.2018.8621955. [10] ZHANG W E, SHENG Q Z, ALHAZMI A, et al. Adversarial attacks on deep-learning models in natural language processing: a survey [J]. ACM Transactions on Intelligent Systems and Technology, 2020, 11(3): 24. DOI: 10.1145/3374217. [11] VON RUEDEN L, MAYER S, BECKH K, et al. Informed machine learning: a taxonomy and survey of integrating prior knowledge into learning systems [J]. IEEE Transactions on Knowledge and Data Engineering, 2023, 35(1): 614–633. DOI: 10.1109/TKDE.2021.3079836. [12] FORRESTAL M J, LUK V K. Dynamic spherical cavity-expansion in a compressible elastic-plastic solid [J]. Journal of Applied Mechanics, 1988, 55(2): 275–279. DOI: 10.1115/1.3173672. [13] 文鹤鸣. 混凝土靶板冲击响应的经验公式 [J]. 爆炸与冲击, 2003, 23(3): 267–274.WEN H M. Empirical equations for the impact response of concrete targets [J]. Explosion and Shock Waves, 2003, 23(3): 267–274. [14] CHEN X W, LI Q M. Deep penetration of a non-deformable projectile with different geometrical characteristics [J]. International Journal of Impact Engineering, 2002, 27(6): 619–637. DOI: 10.1016/S0734-743X(02)00005-2. [15] LI Q M, CHEN X W. Dimensionless formulae for penetration depth of concrete target impacted by a non-deformable projectile [J]. International Journal of Impact Engineering, 2003, 28(1): 93–116. DOI: 10.1016/S0734-743X(02)00037-4. [16] 任辉启, 穆朝民, 刘瑞朝, 等. 精确制导武器侵彻效应与工程防护[M]. 北京: 科学出版社, 2016: 54−58. [17] 陈小伟. 穿甲/侵彻力学的理论建模与分析 [M]. 北京: 科学出版社, 2019. [18] 王清华, 徐丰, 郭伟国. 基于ANN-GA协同寻优的动态拉伸试样尺寸优化方法 [J]. 爆炸与冲击, 2022, 42(1): 014201. DOI: 10.11883/bzycj-2021-0218.WANG Q H, XU F, GUO W G. A method of geometry optimization for dynamic tensile specimen based on artificial neural network and genetic algorithm [J]. Explosion and Shock Waves, 2022, 42(1): 014201. DOI: 10.11883/bzycj-2021-0218. [19] 李秦超, 姚成宝, 程帅, 等. 神经网络状态方程在强爆炸冲击波数值模拟中的应用 [J]. 爆炸与冲击, 2023, 43(4): 044202. DOI: 10.11883/bzycj-2022-0222.LI Q C, YAO C B, CHENG S, et al. Application of the neural network equation of state in numerical simulation of intense blast wave [J]. Explosion and Shock Waves, 2023, 43(4): 044202. DOI: 10.11883/bzycj-2022-0222. [20] MUSTAPHA A, MOHAMED L, ALI K. An overview of gradient descent algorithm optimization in machine learning: Application in the ophthalmology field [C]//The 3rd International Conference on Smart Applications and Data Analysis. Marrakesh, Morocco: Springer, 2020: 349–359. DOI: 10.1007/978-3-030-45183-7_27. [21] ZHANG L, WANG J M, JIANG M W, et al. Evaluation method based on random forests for empirical algorithms of penetration effects [C]//2022 International Conference on Machine Learning, Cloud Computing and Intelligent Mining (MLCCIM). Xiamen, Fujian, China: IEEE, 2022: 73–78. DOI: 10.1109/MLCCIM55934.2022.00020. [22] FULLARD K, BARR P. Development of design guidance for low velocity impacts on concrete floors [J]. Nuclear Engineering and Design, 1989, 115(1): 113–120. DOI: 10.1016/0029-5493(89)90264-1. [23] YOUNG C W. Penetration equations [R]. Albuquerque, NM, United States: Sandia National Lab, 1997. DOI: 10.2172/562498. -