China Safety Science Journal ›› 2025, Vol. 35 ›› Issue (9): 185-192.doi: 10.16265/j.cnki.issn1003-3033.2025.09.1298
• Safety engineering technology • Previous Articles Next Articles
AN Siqi1(
), CAI Anglin2, MA Zicheng2, ZHU Baoyan1,**(
)
Received:2025-04-11
Revised:2025-06-15
Online:2025-09-28
Published:2026-03-28
Contact:
ZHU Baoyan
CLC Number:
AN Siqi, CAI Anglin, MA Zicheng, ZHU Baoyan. Multimodal large model-based approach for construction safety hazard recognition[J]. China Safety Science Journal, 2025, 35(9): 185-192.
Add to citation manager EndNote|Ris|BibTeX
URL: http://www.cssjj.com.cn/EN/10.16265/j.cnki.issn1003-3033.2025.09.1298
Table 3
Comparative analysis of model commonalities and differences
| 特性 | GPT-4 | LLaVA-1.5 | LLaVA-CS |
|---|---|---|---|
| 模型类型 | 通用大规模语言模型,具备多模态能力(文本/图像) | 多模态模型(文本/图像) | 专用多模态模型,针对建筑安全隐患识别进行领域优化 |
| 架构 | 基于Transformer架构 | 基于Transformer结合视觉编码器 | 在LLaVA-1.5基础上引入动态特征融合与上下文适应机制 |
| 输入数据 | 文本输入为主,但支持图像输入 | 同时处理图像与文本数据 | 建筑工地图像与文本数据 |
| 主要应用 | 文本生成、问答、对话等通用自然语言处理任务 | 图像描述、视觉问答等跨模态任务 | 建筑安全隐患的自动识别与解释,为施工安全监控提供决策支持 |
| 训练数据 | 多领域大规模文本数据,部分版本包含图像数据 | 综合图像与文本数据集,专注于跨模态信息融合任务 | 定制化多模态数据集,专注于建筑工地复杂场景中的安全隐患识别 |
Table 4
Examples in the experiment
| 请根据图中的内容判断图中是否存在安全隐患,并给出判断 | ||||
|---|---|---|---|---|
| — | | | | |
| LLaVA-CS | 这是不安全的,因为图中人物在吸烟且缺少防护措施 | 这是不安全的,因为图中内容为缺少防护措施 | 图中不存在安全隐患,因为图中内容为违规脱安全帽 | 这是安全的 |
| GPT-4 | 这是不安全的,因为图中工人在高处工作时没有使用安全带,并且施工平台可能存在坠落风险 | 图中的工人也戴着安全帽和反光背心,看起来他在施工现场。这是安全的行为,没有明显的安全隐患可见 | 基于图中内容的判断,没有发现明显的安全隐患 | 这是不安全的,因为图中的人物正在做出不雅手势 |
| LLaVA-1.5 | 这是不安全的,因为图中人物在没有使用安全带的情况下站在高处 | 这是不安全的,因为图中人物在没有使用任何个人保护设备的情况下,进入了一个正在施工的区域 | 这是不安全的。一个工人在高处作业时没有使用安全带 | 这是不安全的,因为图中人物在高处作业,没有使用安全带 |
| [1] |
郁润. 基于计算机视觉的施工现场工人不安全行为识别方法研究[D]. 北京: 清华大学, 2019.
|
|
|
|
| [2] |
范冰倩, 董秉聿, 王彪, 等. 基于深度学习的地铁施工作业人员不安全行为识别与应用[J]. 中国安全科学学报, 2023, 33(1):41-47.
doi: 10.16265/j.cnki.issn1003-3033.2023.01.0874 |
|
doi: 10.16265/j.cnki.issn1003-3033.2023.01.0874 |
|
| [3] |
左明成, 焦文华. 面向煤矿井下作业场景的安全帽佩戴识别算法[J]. 中国安全科学学报, 2024, 34(3):237-246.
doi: 10.16265/j.cnki.issn1003-3033.2024.03.1985 |
|
doi: 10.16265/j.cnki.issn1003-3033.2024.03.1985 |
|
| [4] |
李健, 奥帅, 张在成, 等. 基于多模态的装配式建筑起重伤害预警模型[C]. 2022年工业建筑学术交流会论文集(上册),2022:440-444.
|
| [5] |
谢定坤. 多模态融合的施工现场工人不安全行为识别方法研究[D]. 武汉: 华中科技大学, 2020.
|
|
|
|
| [6] |
孙昕璐. 基于生理心理多模态监测的施工现场隐患识别能力评估[D]. 北京: 清华大学, 2020.
|
|
|
|
| [7] |
|
| [8] |
|
| [9] |
|
| [10] |
|
| [11] |
|
| [12] |
|
| [13] |
|
| [14] |
|
| [15] |
|
| [16] |
|
| [17] |
|
| [18] |
傅贵, 陈奕燃, 许素睿, 等. 事故致因“2-4”模型的内涵解析及第6版的研究[J]. 中国安全科学学报, 2022, 32(1):12-19.
doi: 10.16265/j.cnki.issn1003-3033.2022.01.002 |
|
doi: 10.16265/j.cnki.issn1003-3033.2022.01.002 |
|
| [19] |
安思齐. 建筑业安全信用评价研究[D]. 葫芦岛: 辽宁工程技术大学, 2023.
|
|
|
|
| [20] |
广东省住房和城乡建设厅. 关于推广使用《广东省建筑施工安全生产隐患识别图集(三)》的通知[EB/OL]. (2023-05-06). https://zfcxjst.gd.gov.cn/gkmlpt/content/4/4180/post_4180540.html#1422.
|
| [21] |
温国锋, 房颖, 张帆帆. 复杂工程项目施工阶段行为风险评价模型[J]. 中国安全科学学报, 2017, 27(8):162-168.
doi: 10.16265/j.cnki.issn1003-3033.2017.08.028 |
|
doi: 10.16265/j.cnki.issn1003-3033.2017.08.028 |
| [1] | CHEN Dawei, YANG Zhe, YU Rui, CAO Weiqiang. Empirical analysis of construction engineering safety impact network influenced by five-party responsible entities [J]. China Safety Science Journal, 2025, 35(4): 1-8. |
| [2] | SHI Zhao, FU Gui, XIE Xuecai, TONG Wenqing, YUAN Chenhui, CHEN Yiran. Development and application of SCAP [J]. China Safety Science Journal, 2022, 32(8): 29-36. |
| [3] | LI Jie, YI Hongyan, LI Naiwen. Investigation on research team and hot topics of accident causation in China [J]. China Safety Science Journal, 2022, 32(7): 20-27. |
| [4] | FU Gui, YANG Xiaoyu, LIU Zhuoxu, TONG Ruipeng, KONG Qingduan, GUO Lijuan. Studies on fundamentals of safety science [J]. China Safety Science Journal, 2021, 31(5): 18-24. |
| [5] | YIN Dezhi, SHUAI Bin, HUANG Wencheng, ZHANG Yue, ZHANG Rui, ZUO Borui. Application of Tropos-FRAM method in road passenger traffic accident analysis [J]. China Safety Science Journal, 2020, 30(8): 151-157. |
| [6] | WU Chengcheng, CHEN Dawei. Safety evaluation of traffic organization during highway construction based on visibility graph analysis [J]. China Safety Science Journal, 2020, 30(5): 122-128. |
| [7] | WANG Lieni, MOU Ruifang, LAI Jie, YANG Jianming, GOU Zhibo. Mechanism research of tramcar collision based on S-O-R [J]. China Safety Science Journal, 2019, 29(S2): 104-110. |
| [8] | LUO Cong, XU Ke, LIU Qian, ZHAO Yunsheng. Discrimination of relevant concepts of safety risk classification control [J]. China Safety Science Journal, 2019, 29(10): 43-50. |
| [9] | FAN Zhengri. Cycle analysis and characteristics for the occurrence of major railway accidents in China [J]. China Safety Science Journal, 2018, 28(S1): 135-140. |
| [10] | GUO Shengyu, GUO Wenhui, GONG Peisong. Research on statistical process control of metro construction workers'unsafe behaviors [J]. China Safety Science Journal, 2018, 28(7): 153-158. |
| [11] | WANG Yang, HUANG Jinhui, FU Shanshan, WEI Xiaoyang, WU Bing. A shift in paradigm for system safety: comparative study of risk and resilience [J]. China Safety Science Journal, 2018, 28(1): 62-68. |
| [12] | LI Jie, CHEN Weijiong. Analyzing academic effect of Heimlich's safety theory [J]. China Safety Science Journal, 2017, 27(9): 1-7. |
| [13] | FU Gui, LI Ya, WANG Xiuming. Research on 24Model based safety management mode for manufacturing enterprises [J]. China Safety Science Journal, 2017, 27(10): 117-122. |
| [14] | . Research on High Speed Railway Drivers' Safety Adaptability and Its Detection Technology [J]. China Safety Science Journal, 2013, 23(6): 9-. |
| [15] | . Analysis of Road Traffic Accidents in China and Measures to Prevent Them [J]. China Safety Science Journal, 2013, 23(11): 120-. |
| Viewed | ||||||
|
Full text |
|
|||||
|
Abstract |
|
|||||