中国安全科学学报 ›› 2026, Vol. 36 ›› Issue (6): 40-50.doi: 10.16265/j.cnki.issn1003-3033.2026.06.1100
收稿日期:2025-11-21
修回日期:2026-02-26
出版日期:2026-06-28
通信作者:
作者简介:![]() |
张景林 (1978—),女,福建福州人,硕士,副教授,主要从事自然语言处理、数据挖掘等方面的研究。E-mail:liniry@qq.com。 |
基金资助:
Zhang Jinglin1(
), Chen Shengqun2,**(
)
Received:2025-11-21
Revised:2026-02-26
Published:2026-06-28
摘要:
为了挖掘危化品爆炸事故报告中的潜在风险信息,提高公众在社交媒体中获取信息时的风险感知力,利用文本挖掘技术、风险评估和深度学习模型,构建一个危化品爆炸事故风险定级的智能模型。首先,提取事故调查报告中的关键信息(危化品、事故原因、事故后果等),依据风险评估矩阵表标注事故报告风险等级;其次,针对危化事故数据的长尾分布特性,提出一种非均衡少样本数据驱动的融合策略,并采用基于变换器的双向编码器表征(BERT)、长短期记忆(LSTM)网络、卷积神经网络(CNN)、门控循环单元(GRU)等4种模型,对比验证增强策略效果;最后,构建一种设有风险因子感知机制的双向门控循环 (BiGRU)神经网络事故风险定级模型。研究结果表明:该定级模型可对危化品爆炸事故进行自动风险评级,同时增加强公众风险认知能力。
中图分类号:
张景林, 陈圣群. 基于少样本数据驱动的危化品爆炸事故风险定级模型[J]. 中国安全科学学报, 2026, 36(6): 40-50.
Zhang Jinglin, Chen Shengqun. Risk rating model for hazardous chemical explosion accidents based on few-shot data-driven approach[J]. China Safety Science Journal, 2026, 36(6): 40-50.
表1
事故发生的可能性(L)等级
| 可能性 | La | Lp |
|---|---|---|
| 极高可能 (L=4) | 在现场没有采取防范、监测、保护、控制措施,或危害的发生不能被发现(没有监测系统),或在正常情况下经常发生此类事故或事件 | 活性极高(如爆炸品、剧毒化学品)、易爆性;无有效防护(如超量存储、违规混放),存在大规模泄漏,导致庞大人员伤亡和环境破坏等;存在非常高的事故风险和极其严重的后果 |
| 较高可能 (L=3) | 危害的发生不容易被发现,现场没有检测系统,也未发生过任何监测,或在现场有控制措施,但未有效执行或控制措施不当,或危害发生或预期情况下发生 | 活性高(如过氧化物、高毒气体)、易燃性;存在很高的事故风险和严重的后果,如防护措施存在漏洞,涉及到大量的有毒气体泄漏、易燃物储存不当等 |
| 有可能 (L=2) | 没有保护措施(如没有保护装置、没有个人防护用品等),或未严格按操作程序执行,或危害的发生容易被发现(现场有监测系统),或曾经作过监测,或过去曾经发生类似事故或事件 | 活性中等(如中度毒性气体、遇水反应化学品)、可燃性;存在一些安全措施不完善的情况,如不良的操作习惯,不合格的容器材质等 |
| 基本不可能 (L=1) | 危害一旦发生能及时发现,并定期进行监测,或现场有防范控制措施,并能有效执行,或过去偶尔发生事故或事件 | 活性较低(如低闪点易燃液体),存在一些不符合安全要求的情况(如储存条件不够理想,防护设施不完善等),但有双重防护措施(如防爆储罐+温度监控) |
表7
BiGRU-RA模型在不同训练集下的相同测试集分类报告
| 训练集 | 准确率/% | 风险等级 | 分类报告/% | ||
|---|---|---|---|---|---|
| 精确度 | 召回率 | F1 | |||
| 原始数据(Raw_data) | 74.38 | 一 | 82.86 | 65.91 | 73.42 |
| 二 | 62.77 | 92.19 | 74.68 | ||
| 三 | 83.72 | 69.23 | 75.79 | ||
| 四 | 80.00 | 69.57 | 74.42 | ||
| 五 | 100 | 55.00 | 70.97 | ||
| 原始数据+回译增强 Raw+Aug(OPUS-MT)_Data | 84.73 | 一 | 79.59 | 88.64 | 83.87 |
| 二 | 89.47 | 79.69 | 84.30 | ||
| 三 | 87.76 | 82.69 | 83.87 | ||
| 四 | 74.07 | 86.96 | 80.00 | ||
| 五 | 90.48 | 95.00 | 92.68 | ||
| 原始数据+基于词 向量的同义词替换增强 Raw+Aug(Word2Vec)_Data | 83.74 | 一 | 81.40 | 79.55 | 80.46 |
| 二 | 79.71 | 85.94 | 82.71 | ||
| 三 | 85.11 | 76.92 | 80.81 | ||
| 四 | 84.00 | 91.30 | 87.50 | ||
| 五 | 100 | 95.00 | 97.44 | ||
| 原始数据+融合(回译和词 向量的同义词替换)增强 Raw+Aug(Word2Vec+OPUS-MT)_Data | 87.19 | 一 | 84.44 | 86.36 | 85.39 |
| 二 | 80.28 | 89.06 | 84.44 | ||
| 三 | 93.48 | 82.69 | 87.76 | ||
| 四 | 95.24 | 86.96 | 90.91 | ||
| 五 | 95.00 | 95.00 | 95.00 | ||
| [1] |
中华人民共和国中央人民政府. 科技部应急部关于印发《“十四五”公共安全与防灾减灾科技创新专项规划》的通知[EB/OL].(2022-11-11). https://www.gov.cn/zhengce/zhengceku/2022-11/11/content_5726118.htm.
|
| [2] |
|
| [3] |
|
| [4] |
王晶晶, 朱伟, 高凯悦, 等. 化工园区危化品事故风险耦合与预测研究[J]. 中国安全生产科学技术, 2025, 21 (1):31-37.
|
|
|
|
| [5] |
袁晨辉, 时雅倩, 麻勇, 等. 基于24Model的事故原因系统分析与调查报告对比:以响水爆炸事故为例[J]. 中国安全科学报, 2022, 32(7):48-55.
|
|
doi: 10.16265/j.cnki.issn1003-3033.2022.07.1859 |
|
| [6] |
张江石, 李泳暾, 冒香凝, 等. 基于NLP的煤矿事故原因分类研究[J]. 中国安全科学学报, 2023, 33(6):20-26.
doi: 10.16265/j.cnki.issn1003-3033.2023.06.1416 |
|
doi: 10.16265/j.cnki.issn1003-3033.2023.06.1416 |
|
| [7] |
|
| [8] |
doi: 10.21285/2500-1582 |
| [9] |
林其彪, 李鑫, 葛樊亮, 等. 基于数据驱动贝叶斯网络的化工事故风险分析[J]. 中国安全生产科学技术, 2024, 20(4):180-185.
|
|
|
|
| [10] |
曾小红, 毕海普, 司鹄. 化工园区泄漏事故安全风险评估模式研究[J]. 中国安全科学学报, 2011, 21(2):165-170.
|
|
|
|
| [11] |
|
| [12] |
张海波, 牛一凡. 事故调查如何促进风险防范?:基于167份事故调查报告的实证分析[J]. 行政论坛, 2022, 29(2):62-73.
|
|
|
|
| [13] |
许爱国. 文本挖掘支持下的煤矿安全风险识别与评价[J]. 自动化博览, 2024, 41(11):73-77.
|
|
|
|
| [14] |
|
| [15] |
|
| [16] |
田震, 沈艳洋, 赖恩. 基于相对风险管控能力的化工企业风险分级方法[J]. 安全与环境学报, 2023, 23(8):2598-2606.
|
|
|
|
| [17] |
doi: 10.1007/s00603-013-0464-x |
| [18] |
GB/T 30 000.31—2023 化学品分类和标签规范.第31部分:化学品作业场所警示性标志[S].
|
|
GB/T 30 000.31-2023 Specification for classification and labelling of chemicals—part 31:precautionary label for workplace of chemicals[S].
|
|
| [19] |
GB 30 000.2—2013 化学品分类和标签规范.第2部分:爆炸物[S].
|
|
GB 30 000.2-2013 Rules for classification and labelling of chemicals - Part 2:explosives[S].
|
|
| [20] |
中华人民共和国中央人民政府. 国务院《生产安全事故报告和调查处理条例》[EB/OL].(2008-03-28). https://www.gov.cn/zhengce/content/2008-03/28/content_4363.htm.
|
| [21] |
许德龙, 林民, 王玉荣, 等. 基于大语言模型的NLP数据增强方法综述[J]. 计算机科学与探索, 2025, 19(6):1395-1413.
doi: 10.3778/j.issn.1673-9418.2410054 |
|
|
|
| [22] |
宋中山, 牛悦, 郑禄, 等. 多尺度CNN卷积与全局关系的中文文本分类模型[J]. 计算机工程与应用, 2023, 59(20): 103-110.
doi: 10.3778/j.issn.1002-8331.2209-0093 |
|
|
|
| [23] |
|
| [24] |
王伟, 孙玉霞, 齐庆杰, 等. 基于BiGRU-attention神经网络的文本情感分类模型[J]. 计算机应用研究, 2019, 36(12):3558-3564.
|
|
|
| [1] | 祁云, 姚瑞, 詹辛慧, 薛凯隆, 井雪艳, 齐庆杰. 改进YOLOv9m的矿井外因火灾检测[J]. 中国安全科学学报, 2026, 36(6): 110-118. |
| [2] | 高学鸿, 曹昊轩, 黄国忠, 高深远, 刘瑾洲. 基于改进YOLOv11的古建筑场景下可燃危险品检测模型[J]. 中国安全科学学报, 2026, 36(6): 119-126. |
| [3] | 荣海, 习洲勇, 李锦程, 潘相伊, 张伟达, 韩明玉. SPDs-Conv与WIoU优化的YOLOv8n矿井井下人员检测模型[J]. 中国安全科学学报, 2026, 36(5): 139-149. |
| [4] | 曹海青, 姚志英, 吕淑然, 姚翠友. 融合注意力机制的LSTM职工心理压力状态评价方法[J]. 中国安全科学学报, 2026, 36(3): 229-237. |
| [5] | 田水承, 李红妍, 石炎彬, 田方圆, 王亚娟, 段梦菲. 警觉度影响下矿工风险感知能力识别模型[J]. 中国安全科学学报, 2026, 36(2): 1-8. |
| [6] | 卢毅, 尚远望, 王宇航, 岳丹凤. 决策者风险感知对洪涝灾害应急物资调配的影响[J]. 中国安全科学学报, 2026, 36(1): 182-190. |
| [7] | 胡啸峰, 滕腾, 胡今鸣, 温家骏. 机械加工车间作业人员不安全行为识别模型[J]. 中国安全科学学报, 2025, 35(8): 40-47. |
| [8] | 徐磊, 崔雄博, 赵刘昌, 任超宇, 彭金栓. 面向典型风险情景的驾驶人潜在风险感知能力评估[J]. 中国安全科学学报, 2025, 35(4): 181-188. |
| [9] | 江新, 李锋彪, 彭佳雨, 简丽, 晋良海. 风险感知对地下洞室群施工人员安全认知的作用机制[J]. 中国安全科学学报, 2025, 35(3): 1-9. |
| [10] | 曹淑超, 戈伟斌, 李聪慧, 张俊. 基于注意力Seq2Seq网络的人群安全风险评估[J]. 中国安全科学学报, 2025, 35(12): 196-203. |
| [11] | 刘光伟, 张浩博, 雷健, 黄云龙, 任崇辉. 面向露天矿无人矿卡行驶障碍物检测模型[J]. 中国安全科学学报, 2025, 35(11): 49-55. |
| [12] | 陈勇, 张翼. 自然灾害高风险区农户不迁移意愿影响因素与形成路径[J]. 中国安全科学学报, 2025, 35(11): 9-15. |
| [13] | 钟兴润, 田晨斌, 李新宏, 孟晓静, 杨文欣. 基于改进U-Net的城市洪涝灾害图像识别模型[J]. 中国安全科学学报, 2025, 35(10): 190-197. |
| [14] | 郝秦霞, 张家千. 矿井输送带运输区矿工不安全行为识别模型[J]. 中国安全科学学报, 2025, 35(10): 98-105. |
| [15] | 李崔茜, 王义保, 刘志翔. 居民感知视角下城市公共安全韧性评估及提升路径研究:以南京市为例[J]. 中国安全科学学报, 2024, 34(9): 209-216. |
| 阅读次数 | ||||||
|
全文 |
|
|||||
|
摘要 |
|
|||||
京公网安备 11010502045206号