为提高车辆切入测试场景中交通车的交互能力,提出一种基于深度强化学习方法的车辆危险切入策略设计方法。首先,基于可扩展多智能体强化学习培训学校(SMARTS)仿真平台构建仿真环境;然后,采用双延迟深度确定性策略梯度算法(TD3)训练智能体危险切入随机选定的目标车辆,将该算法与近端策略优化算法(PPO)和深度确定性策略梯度算法(DDPG)进行对比,在7种不同车辆密度的场景中测试训练后的模型;最后,构建多智能体测试环境,将所训练模型用于智能驾驶策略的验证。结果表明: 模型在训练中的危险切入成功率达80.35%,优于2种对比方法;在模型测试中,除2 700辆/h测试场景外,该模型在另外3个未在训练中使用的测试场景均达到80%以上的危险切入成功率,显示出良好的泛化能力。同时,切入时刻与目标车的碰撞时间值显示95%集中在0~6 s,取值在(0,2]、(2,4]和(4,6]s的占比分别为60%、30%和5%,可覆盖具有不同碰撞风险的测试工况。在智能驾驶策略验证中,采用所训练模型控制的交通车能主动切入至待测车辆前方,使待测车辆面临追尾风险,有助于发现智能驾驶策略的安全隐患。