China Safety Science Journal ›› 2023, Vol. 33 ›› Issue (2): 23-30.doi: 10.16265/j.cnki.issn1003-3033.2023.02.0034
• Safety social science and safety management • Previous Articles Next Articles
ZHU Tong1(), QIN Dan1, WEI Wen1, REN Jie1, FENG Yidong2,**(
)
Received:
2022-10-17
Revised:
2022-12-21
Online:
2023-02-28
Published:
2023-08-28
ZHU Tong, QIN Dan, WEI Wen, REN Jie, FENG Yidong. Research on accident risk identification and influencing factors of bus drivers based on machine learning[J]. China Safety Science Journal, 2023, 33(2): 23-30.
Add to citation manager EndNote|Ris|BibTeX
URL: http://www.cssjj.com.cn/EN/10.16265/j.cnki.issn1003-3033.2023.02.0034
Tab.1
Characteristic variables and codes
特征类型 | 特征名称 | 类型 | 编码 |
---|---|---|---|
因变量 | 时段是否发生责任事故 | 定序 | 0=未发生;1=发生 |
驾驶员 特征 | 性别 | 定类 | [1,0]=男;[0,1]=女 |
年龄 | 定序 | 1=≤25;2=26-35;3=36-45;4=46-55;5=≥56 | |
驾龄 | 定序 | 1=≤2;2=3-5;3=6-10;4=11-15;5=16-20;6=≥21 | |
文化程度 | 定序 | 1=小学;2=初中;3=职高中专及技校;4=高中;5=大专;6=大学及以上 | |
用工形式 | 定类 | [1,0,0]=合同工;[0,1,0]=计划外聘用;[0,0,1]=计划外社会 | |
车辆 特征 | 车层 | 定序 | 1=单层;2=双层 |
车辆动力类型 | 定类 | [1,0,0]=纯电动;[0,1,0]=混合动力;[0,0,1]=天然气动力 | |
车辆服役时间 | 连续 | =年 | |
线路 特征 | 线路站点数 | 连续 | =站 |
线路类型 | 定序 | [1,0,0]=建成区外;[0,1,0]=跨建成区内外;[0,0,1]=建成区内 | |
线路长度 | 连续 | =公里 | |
违规 行为 特征 | 违规次数 | 连续 | =次 |
累计违规等级 | 连续 | =级 | |
平均违规等级 | 连续 | =级 | |
距上次违规时长 | 定序 | 1=未发生过违规;2=1个月以内;3=3个月以内;4=半年以内; 5=1年以内;6=2年以内;7=3年以内;8=超过3年 | |
违规晴天占比 | 定序 | 1=未发生过;2=Ti时段内晴天低于非晴天;3=Ti时段内晴天 等于非晴天;4=Ti时段内晴天高于非晴天 | |
违规早晚高峰占比 | 定序 | 1=未发生过违规;2=早晚高峰小于平峰;3=早晚高峰 等于平峰;4=早晚高峰大于平峰 | |
违规去程占比 | 定序 | 1=未发生过违规;2=去程小于回程;3=去程等于回程; 4=去程大于回程 | |
历史同月是否发生违规 | 定类 | 0=未发生;1=发生 | |
历史同季是否发生违规 | 定类 | 0=未发生;1=发生 | |
事故 特征 | 事故次数 | 连续 | =次 |
距上次事故时长 | 定序 | 1=之前未发生过事故;2=1个月以内;3=3个月以内;4=半年以内; 5=1年以内;6=2年以内;7=3年以内;8=超过3年 | |
事故晴天占比 | 定序 | 1=未发生过事故;2=Ti时段内晴天低于非晴天;3=Ti时段内晴天 等于非晴天;4=Ti时段内晴天高于非晴天 | |
事故早晚高峰占比 | 定序 | 1=未发生过事故;2=早晚高峰小于平峰;3=早晚高峰 等于平峰;4=早晚高峰大于平峰 | |
事故去程占比 | 定序 | 1=未发生过违规;2=去程小于回程;3=去程等于回程; 4=去程大于回程 | |
历史同月是否发生事故 | 定类 | 0=未发生;1=发生 | |
历史同季是否发生事故 | 定类 | 0=未发生;1=发生 | |
Ti时段是否发生事故 | 定序 | 0=未发生;1=发生 | |
时段是否发生事故 | 定序 | 0=未发生;1=发生 | |
时段是否发生事故 | 定序 | 0=未发生;1=发生 | |
时段是否发生事故 | 定序 | 0=未发生;1=发生 | |
时段是否发生事故 | 定序 | 0=未发生;1=发生 | |
管理 特征 | 培训总次数 | 连续 | =次 |
处罚总次数 | 连续 | =次 | |
平均处罚等级 | 连续 | =级 | |
批评教育总次数 | 连续 | =次 |
Tab.2
Evaluation indicator and meaning
判断指标 | 指标含义 | 评估依据 | 评估标准 |
---|---|---|---|
准确率 | 预测正确的样本占总样本的比例 | (TP+TN)/(TP+TN+FP+FN) | 值越高越好 |
精准率 | 预测为正例的样本中真实正例的比例 | TP/(TP + FP) | 值越高越好 |
命中率 | 真正例被预测为正例的比例 | TP/(TP + FN) | 值越高越好 |
F1值 | 调和平均的查准率和查全率 | 越接近1越好 | |
AUC | ROC曲线下的面积 | 值越高越好 | |
虚报率 | 假正例被预测为反例的比例 | FP/(TN + FP) | 值越低越好 |
未命中率 | 假反例被预测为正例的比例 | FN/(TP + FN) | 值越低越好 |
Tab.3
Multi-criterion integrated feature selection results for risky bus drivers
特征类型 | 特征名称 | 平均值 |
---|---|---|
违规 特性 | 违规次数 | 0.527 |
平均违规等级 | 0.376 | |
违规时间间隔离散程度 | 0.184 | |
距离上次违规时长 | 0.133 | |
违规晴天占比 | 0.429 | |
违规早晚高峰占比 | 0.442 | |
违规去程占比 | 0.509 | |
历史同月是否发生违规 | 0.163 | |
历史同季是否发生违规 | 0.196 | |
事故 特性 | 事故次数 | 0.211 |
Ti是否发生事故 | 0.202 | |
Ti-1是否发生事故 | 0.209 | |
Ti-4是否发生事故 | 0.133 | |
培训 次数 | 处罚总次数 | 0.372 |
平均处罚等级 | 0.564 | |
批评教育总次数 | 0.152 | |
培训总次数 | 0.144 | |
驾驶员 特性 | 用工形式 | 0.107 |
性别 | 0.205 | |
年龄 | 0.196 | |
驾龄 | 0.172 | |
文化程度 | 0.159 | |
线路 特性 | 线路长度 | 0.222 |
线路站点数 | 0.181 | |
车辆 特性 | 车辆动力类型 | 0.173 |
车辆服役时间 | 0.406 |
Tab.4
Comparison of risk bus driver identification model indicators%
模型 | 准确率 | 精准率 | 命中率 | F1值 | AUC |
---|---|---|---|---|---|
逻辑回归 | 99.81 | 99.84 | 99.98 | 99.91 | 90.96 |
朴素贝叶斯 | 76.57 | 99.99 | 76.54 | 86.71 | 89.28 |
决策树 | 99.84 | 100.00 | 100.00 | 100.00 | 77.84 |
随机森林 | 99.84 | 100.00 | 100.00 | 100.00 | 88.04 |
GBDT | 99.77 | 99.84 | 99.93 | 99.89 | 85.83 |
XGBoost | 98.66 | 99.91 | 98.75 | 99.33 | 96.31 |
[1] |
|
[2] |
doi: 10.3390/ijerph16081342 |
[3] |
|
[4] |
doi: 10.1080/15389588.2012.759654 pmid: 23944832 |
[5] |
doi: 10.1016/j.tourman.2011.09.011 |
[6] |
doi: 10.3390/ijerph15081626 |
[7] |
doi: 10.1016/j.aap.2013.12.022 |
[8] |
doi: 10.1016/j.trf.2020.05.015 |
[9] |
doi: 10.1108/13683040310509287 |
[10] |
王晓勇, 罗珅, 任杰, 等. 公交驾驶员违规间隔时间及影响因素研究[J]. 中国安全科学学报, 2019, 29(6):128-133.
doi: 10.16265/j.cnki.issn1003-3033.2019.06.021 |
doi: 10.16265/j.cnki.issn1003-3033.2019.06.021 |
|
[11] |
林庆丰, 邓院昌, 张圆, 史晨军. 公交驾驶员驾驶愤怒量表的编制及初步应用[J]. 中国安全科学学报, 2018, 28(6):49-54.
doi: 10.16265/j.cnki.issn1003-3033.2018.06.009 |
doi: 10.16265/j.cnki.issn1003-3033.2018.06.009 |
|
[12] |
闭小梅, 闭瑞华. KNN算法综述[J]. 科技创新导报, 2009(14): 31.
|
|
|
[13] |
|
[14] |
|
[15] |
何清, 李宁, 罗文娟, 等. 大数据下的机器学习算法综述[J]. 模式识别与人工智能, 2014, 27(4): 327-336.
|
|
|
[16] |
doi: 10.1613/jair.953 |
[17] |
doi: 10.1214/aos/1013203450 |
[18] |
|
[19] |
doi: 10.1016/j.aap.2021.106203 |
[20] |
doi: 61. 10.3390/infrastructures5070061 |
[1] | NIU Tianhui, GENG Dianqiao, YUAN Yi, ZHAO Liang, DONG Hui, WANG Bai. Research status and prospect of fire origin determination based on fire traces [J]. China Safety Science Journal, 2024, 34(1): 238-246. |
[2] | WEN Huiying, HUANG Kunhuo, ZHAO Sheng. Prediction of rear-end collision risk of freeway trucks based on machine learning [J]. China Safety Science Journal, 2023, 33(9): 173-180. |
[3] | CHENG Rui, PAN Ye, DAI Junji, WANG Tao, XIE Zhongcao. Research overview of roadside accident risk assessment and roadside safety design [J]. China Safety Science Journal, 2023, 33(9): 214-226. |
[4] | JIN Chunling, JI Zhaotai, GONG Li, AN Xiang, ZHOU Yi. Evaluation model of rockburst intensity of diversion tunnel based on WOA-SVM [J]. China Safety Science Journal, 2023, 33(9): 41-48. |
[5] | DUAN Zaipeng, LI Fan, GUO Jin, LI Jiong. Integrated warning model for structural safety of buildings in urban waterlogged area [J]. China Safety Science Journal, 2023, 33(7): 173-180. |
[6] | ZHAO Wei, LI Shuquan. Prediction model of safety competency of construction workers based on machine learning [J]. China Safety Science Journal, 2023, 33(7): 51-57. |
[7] | ZHANG Xiliang, JIAO Haokai, LI Erbao. Prediction of vibration velocity of deep blasting based on transfer learning [J]. China Safety Science Journal, 2023, 33(6): 64-72. |
[8] | WANG Aidi, XING Yingying, ZHANG Shiwen, LU Jian. Research on risk factors of hazardous material highway transport accidents based on association rules [J]. China Safety Science Journal, 2023, 33(6): 159-165. |
[9] | DUAN Zaipeng, LI Jiong, LI Fan, LIU Biqiang. Structural safety early warning model of rural reconstruction houses [J]. China Safety Science Journal, 2023, 33(4): 100-106. |
[10] | HE Shubo, XIANG Wei, SHI Zhongmiao. Risk early warning of electric vehicle battery system based on machine learning [J]. China Safety Science Journal, 2023, 33(2): 159-165. |
[11] | GUO Zhen, JIA Xiaoyan, LI Fumin, HU Yan, YAN Qiuyan. Fast prediction for building fire spread based on machine learning [J]. China Safety Science Journal, 2023, 33(11): 117-125. |
[12] | ZHU Xin, LI Jianwei, GUO Wei, BI Sheng, WU Yuefei. Forest fire risk prediction model based on machine learning [J]. China Safety Science Journal, 2022, 32(9): 152-157. |
[13] | CHEN Yongqiang, WU Zhipeng, YANG Xiangjuan, CHEN Pu, SUN Shuli. Review on regional seismic analysis software [J]. China Safety Science Journal, 2022, 32(9): 126-136. |
[14] | ZHANG Yu, ZHAO Biliu, LIU Hongyong. Study on accident risk perception bias based on emotion analysis [J]. China Safety Science Journal, 2022, 32(8): 16-22. |
[15] | ZHANG Kai, ZHANG Ke. Prediction study on slope stability based on LightGBM algorithm [J]. China Safety Science Journal, 2022, 32(7): 113-120. |
Viewed | ||||||
Full text |
|
|||||
Abstract |
|
|||||