第21卷第3期2021年6月
交通运输系统工程与信息
Journal of Transportation Systems Engineering and Information Technology
V ol.21No.3
June2021
文章编号:1009-6744(2021)03-0214-07中图分类号:U491.31文献标志码:A DOI:10.16097/jki.1009-6744.2021.03.027
基于均值异质性随机参数Logit模型的城市道路事故
驾驶员受伤严重程度研究
宋栋栋1,杨小宝*1,祖兴水2,四兵锋1
(1.北京交通大学,综合交通运输大数据应用技术交通运输行业重点实验室,北京100044;
2.贵阳市公安交通管理局,贵阳550000)
摘要:驾驶员事故严重程度诱因分析对减少伤亡事故具有重要意义,以往研究假定影响变量为固定参数容易导致参数估计及研究推论出现偏差,据此本文基于均值异质性的随机参数Logit模型深入研究城市道路事故驾驶员受伤严重程度。使用2015—2019年发生在贵阳市的道路交通事故数据,综合考虑驾驶员、车辆、道路、环境特征等潜在影响因素,同时利用平均边际效应量化各显著变量对事故严重程度的影响。结果表明,均值异质性随机参数Logit模型具有更好的拟合优度;女性、老年人、酒后驾驶、车辆无安全气囊、能见度低于50m、夜间无路灯照明等因素显著增加了驾驶员受伤害严重程度;随机参数Logit模型的效用函数中,夜间有路灯照明和事故发生在夜间为随机变量,且夜间有路灯照明与柔性护栏和车辆无安全气囊相关;事故发生在夜间与路侧行道树相关。
关键词:城市交通;事故严重程度;事故影响因素;均值异质性的随机参数Logit模型;平均边际效应
Examination of Driver Injury Severity in Urban Crashes:A Random Parameters Logit Model with Heterogeneity in Means Approach SONG Dong-dong1,YANG Xiao-bao*1,ZU Xing-shui2,SI Bing-feng1
(1.MOT Key Laboratory of Transport Industry of Big Data Application Technologies for Comprehensive Transport,Beijing Jiaotong University,Beijing100044,China,2.Guiyang Public Security Traffic Administration Bureau,Guiyang550000,China) Abstract:Analyzing the factors that are
cloly related to the driver injury verity in the accident is of great significance to reduce casualties.However,most existing literatures assume that the significant parameters are fixed, which may lead to biad and inconsistent parameter estimates,even erroneous inferences.This paper examines the driver injury verity in urban crashes bad on the random parameters Logit model with heterogeneity in means.Using the road crash data of Guiyang city from2015to2019,this study investigates the potential impact factors in terms of drivers,vehicles,roads,and environment characteristics.The average marginal effect is ud to quantify the impact of each significant variable on the verity of the crash.The results show that the random parameters Logit model with heterogeneity in means has superior statistical performance.There are some factors that increa the driver's injury verity,for example,women driver,elderly driver,drunk driving,vehicles without airbags,visibility below50meters, and no streetlights at night.In the Logit model,streetlights at night and crashes at night are random variables.The streetlights at night variable is co-related with the flexible guardrail and the abnce of airbags.Crashes occurring at night variable is co-related with the road gment with roadside trees.
Keywords:urban traffic;injury verity of traffic accident;accident factors;random parameters Logit model with heterogeneity in means;average marginal effect
收稿日期:2020-12-22修回日期:2021-02-01录用日期:2021-04-06
基金项目:中央高校基本科研业务费专项资金/Fundamental Rearch Funds for the Central Universities(2020YJS079);国家自然科学基金/National Natural Science Foundation of China(91746201,71621001)。
作者简介:宋栋栋(1995-),男,甘肃秦安人,博士生。*通信作者:***************
第21卷第3期基于均值异质性随机参数Logit模型的城市道路事故驾驶员受伤严重程度研究
0引言
近年来,许多学者基于离散选择模型研究驾驶员事故受伤严重程度。张圆等[1]基于二项Logit模型建立不同性别驾驶员交通事故严重程度的影响,马壮林等[2]采用有序Logit和广义有序Logit模型,分析影响公路隧道事故严重程度的诱因。
但传统Logit模型假定各因素对事故严重程度的影响在不同事故中是不变的,这与实际不符。据此,部分学者为解释事故数据中存在的异质性问题引入了随机参数Logit模型。Kim等[3]基于随机参数Logit模型研究了加利福尼亚单车事故驾驶员伤害严重性,陈昭明等[4]基于相关随机参数Logit模型研究了高速公路交通事故严重程度,Yu等[5]基于随机参数Logit模型研究了与降雪相关乡村道路单车事故驾驶员受
伤严重程度影响因素的异质性。Uddin等[6]基于随机参数Logit模型研究了不同天气条件下货车相关事故驾驶员受伤严重程度。Alogaili等[7]基于随机参数Logit模型研究了沙特阿拉伯事故严重程度异质性及驾驶员国籍的影响。
与传统Logit模型相比,随机参数Logit模型拟合效果更优,且捕捉了可能的随机变量,但它并未解释造成随机系数的可能影响因素,即考虑可能的均值异质性,为此发展了考虑均值异质性的随机参数模型方法。刘建荣等[8-9]运用该方法揭示了市内出行方式选择行为以及步行时间对老年人公交选择行为影响因素的均值异质性。Hou等[10]基于均值异质性的随机参数Logit模型研究了高速公路驾驶员的受伤严重程度问题,但城市道路与高速公路在交通事故特征及其影响因素等方面有着显著不同,且国内与国外的交通存在一定差异,因此有必要针对我国城市道路交通事故严重程度进行深入研究。
1数据描述
基于2015—2019年发生在贵阳市的事故数据,经预处理,最终用于本研究的事故总数为4483起,其中,受伤事故3213(71.67%)、死亡事故785 (17.51%)、仅财产损失事故485(10.82%)。
以仅财产损失、受伤、死亡这3种事故等级作为因变量,从驾驶员、车辆、道路及环境等4个方面选取44个潜在影响变量,其显著变量的描述性统计如表1所示。
表1受伤程度模型中显著变量的描述性统计Table1Descriptive statistics of significant variables in injury verity model
变量名称
驾驶员特征车辆特征道路特征环境特征
女性
老年
酒后驾驶
高级驾驶员
事故未处理
倒车
变更车道
右转
左转或掉头
无气囊
安全气囊碰撞后未展开
柔性护栏
波形护栏
绿化带护栏
行道树
路表潮湿
匝道口
晴
雨雪雾
能见度100~200m
能见度50m以下
事故发生在夜间
夜间无路灯照明
夜间有路灯照明
字段解释
女性为1,其他为0
>60岁为1,其他为0
酒后驾驶为1,其他为0
>10年驾龄为1,其他为0
机动车状态为事故未处理记为1,其他为0
车辆行驶状态是倒车记为1,其他为0
车辆行驶状态是变更车道记为1,其他为0
车辆行驶状态是右转记为1,其他为0
车辆行驶状态是左转或掉头记为1,其他为0
车辆无安全气囊记为1,其他为0
车辆安全气囊碰撞后,未展开记为1,其他为0
路测防护设施类型是柔性护栏记为1,其他为0
路测防护设施类型是波形护栏记为1,其他为0
路测防护设施类型是绿化带护栏记为1,其他为0
路测防护设施类型是行道树记为1,其他为0
路表潮湿记为1,其他为0
路口路段类型是匝道口记为1,其他为0
天气是晴记为1,其他为0
天气是雨雪雾记为1,其他为0
能见度100~200m记为1,其他为0
能见度50m以下记为1,其他为0
事故发生在20:00-次日8:00记为1,其他为0
夜间无路灯照明记为1,其他为0
夜间有路灯照明记为1,其他为0
215
交通运输系统工程与信息2021年6月2模型方法
考虑均值异质性的随机参数Logit模型,对驾
驶员受伤程度进行预测。其中,驾驶员事故受伤程
度分为仅财产损失、受伤、死亡这3个等级。驾驶
员事故受伤程度的效用函数为
S ni =β
ni
X
n
+ε
ni
(1)
式中:S
ni
为发生的第n起事故中,驾驶员的受伤程
度为i的效用函数;X
n
为第n起事故不因受伤程度
i的变化而改变的解释变量向量;β
ni
为估计参数向
量;ε
ni
为误差项。若误差项服从广义极值分布,则构成标准的多项Logit模型,即
p ni =
exp()βni X n
∑∀I exp()βnj X n(2)
式中:p
ni
为在第n起事故中,驾驶员的受伤程度为i的概率;I为所有受伤程度的集合(仅财产损失、受伤、死亡)。
传统Logit模型假定各因素对事故严重程度的影响在不同事故中固定不变,这与实际不符。为解
释事故数据中可能存在的异质性,通过在β
ni
中添
圣迹苍岩加随机项,引入随机参数Logit模型,即β
ni
可以被表达为固定参数和随机项的线性组合。
β
自制酸豆角
ni =β
i
+Γ
i
ν
ni
(3)
式中:β
i 为对所有驾驶员都相同的固定参数;Γ
i
ν
ni
为随机项,其中,Γ
i
为系数矩阵,表征各随机参数
间协方差及潜在相关性,v
ni
为均值为0,协方差矩阵为单位矩阵的随机项。
随机参数Logit模型并未解释造成随机系数的可能影响因素,即考虑未观察到的异质性可能出现在参数的均值中。为此,通过添加均值异质性向
量,引入均值异质性的随机参数Logit模型,记β
ni 为不同事故间变化的估计参数向量。
β
ni =β
i
+Δω
i
+Γ
i
ν
ni
(4)
式中:ω
n
为与人、车、路、环境等属性相关的均值异质性向量;Δ为相对应的估计参数向量,最终将效用函数和传统Logit模型扩展为
S ni =β
ni
X
i
+ε
ni
=()
β
i
+Δω
n
X
n
+Γ
i
ν
ni
X
n
+ε
ni
(5)
p ni(
)
|X nβni=∫exp()βni X n
∑∀I exp()βnj X n f()|νni0,I dνni(6)
式中:f()
|νni0,I为νni的联合概率密度函数。
均值异质性的随机参数Logit模型估计采用基于仿真的最大似然方法,概率密度函数f()
|νni0,I 通过数值评估的方法决定。其中,对数似然函数表示为
LL()βni=∑n=1N∑i=1I y ni ln1R∑r=1R P ni()|X nβni,νr ni(7)式中:LL()βni为仿真对数似然函数;N为总样本数
量;r为Halton序列抽样;P
ni
为第n起事故中,驾
驶员的受伤程度为i的概率;y
ni
为0-1变量,当驾驶
员n的事故受伤程度为i时,y
ni
为1,否则为0;R 为总的抽样次数。采用Halton序列抽样,基于仿真的最大似然估计方法在NLOGIT5.0软件中实现,参考相关研究,抽样次数取200次[11]。事故严重程度的平均边际系数为
Eˉp ni x nk=1N∑n=1N p ni()x nk-p ni()x nk=0
p
ni()
x
nk=0
(8)式中:Eˉp ni x nk为第k个因素对事故严重程度i的平均
边际系数;P
ni
()
x
nk
为驾驶员n的事故受伤程度为i
时的概率;x
nk
为驾驶员n的事故受伤程度为i时的第k个显著变量。
3结果讨论
基于传统Logit模型、随机参数Logit模型和均值异质性的随机参数Logit模型对驾驶员受伤严重程度进行估计,3种模型估计结果如表2所示。AIC 值越小或模型收敛的对数似然值越高,模型的拟合性能越优。由表2可知,传统Logit模型、随机参数Logit模型和均值异质性的随机参数Logit模型的AIC值分别为6081.3、6070.6、6062.9,对数似然值分别为-2984.663、-2972.220、-2963.324。因此均值异质性的随机参数Logit模型拟合性能最优。3.1随机参数
随机参数Logit模型估计结果表明,女性、夜间有路灯照明、事故发生在夜间这3个变量具有随机参数特性。女性变量服从N(1.016,1.721)的正态分布,即72.25%的女性驾驶员发生受伤事故的概率高于男
性驾驶员。类似可得,夜间有路灯照明变量的参数服从N(-0.825,2.122)的正态分布,事故发生在夜间变量的参数服从N(-1.472,2.164)的正态分布,具体表现为在夜间有路灯照明时,65.13%的驾驶员会降低其发生严重伤亡事故的概率;同时,75.18%的驾驶员在夜间开车会更为谨慎从而降低其发生严重伤亡事故的概率。
216
第21卷第3期基于均值异质性随机参数Logit模型的城市道路事故驾驶员受伤严重程度研究
表22015—2019年驾驶员受伤程度的Logit模型估计结果比较
Table2Comparison of Logit model estimation results of driver injury verity from2015to2019变量名称
constant[MI]
constant[SI]
驾驶员特征车辆特征道路特征环境特征随机参数的
均值异质性模型估计
女性[MI]
变量女性的标准差
老年[MI]
老年[SI]
酒后驾驶[MI]
酒后驾驶[SI]
高级驾驶员[MI]
高级驾驶员[SI]
事故未处理[MI]
事故未处理[SI]
倒车[MI]
倒车[SI]
变更车道[SI]
右转[SI]
左转或掉头[MI]
无气囊[SI]
安全气囊碰撞后未展开[MI]
安全气囊碰撞后未展开[SI]
柔性护栏[MI]
柔性护栏[SI]
波形护栏[SI]
绿化带护栏[SI]
行道树[MI]
奔波的意思路表潮湿[SI]
累感不爱匝道口[MI]
匝道口[SI]
晴[MI]
雨雪雾[SI]
能见度100~200m[SI]
能见度50m以下[SI]
事故发生在夜间[MI]
事故发生在夜间[SI]
事故发生在夜间的标准差
夜间无路灯照明[MI]
夜间有路灯照明[MI]
夜间有路灯照明的标准差
夜间有路灯照明[SI]
夜间有照明、柔性护栏
夜间有照明、无安全气囊
事故发生在夜间、行道树
样本量
仅含常数的对数似然
模型收敛的对数似然
McFadden Pudo R-Squared
AIC
传统多项
Logit模型
参数估计
3.118
1.726
—
—
0.502
0.594
2.020
1.781
-0.314
-0.550
0.381
0.410
-0.557
-0.860
-0.715
-0.837
0.504
0.320
0.495
1.123
-1.704
-1.434
0.772
0.484
0.393
亮作文-0.331
-0.878
-1.053
0.311
0.426
-0.298
0.342
-0.787
-0.650
—
-0.715
-1.390
—
-1.521
—
—
—
4483
-3516.557
-2984.663
0.151
6081.300
z-stat
12.930
6.400
—
—
3.290
3.450
15.140
9.920
-1.980
-3.000
2.880
2.750
-1.720
-2.100
-1.760
-
2.480
2.100
2.310
2.170
4.550
-2.900
-1.690
2.550
2.010
3.120
-1.670
-
2.820
-2.760
1.990
1.930
-1.720
1.650
-6.170
-4.460
—
-3.190
-8.750
—
-8.370
—
—
—
仅随机参数
Logit模型
参数估计
3.148
1.685
1.016
1.721
0.665
0.764
2.692
2.463
-0.411
-0.745
0.501
0.548
—
-0.947
—
-
0.855
0.890
0.374
0.485
1.324
-2.236
—
0.914
0.606
0.510
-0.474
-
1.061
-1.318
0.389
0.540
—
0.530
-0.880
-1.472
2.164
-0.436
-0.825
2.122
-2.041
—
—
—
4483
-3516.557
-2972.220
0.397
6070.600
z-stat
10.940
5.180
1.700
1.870
3.430
3.520
10.920
8.210
-2.040
-3.210
2.980
2.920
—
-1.970
—
-2.100
1.700
2.110
1.670
4.090
-2.820
—
2.550
1.980
3.070
-1.850
-2.880
-2.900
2.040
1.900
—
1.710
-5.600
-
3.460
3.400
-1.710
-3.380
4.730
-3.050
—
—
—
均值异质性的
随机参数Logit模型
参数估计
3.084
1.584
2.109
3.485
0.675
0.782
2.670
2.411
-0.423
-0.756
0.495
0.539
—
-0.894
—
-0.820
—
0.516
—
1.336
-2.247
—
1.180
0.577
0.559
-0.477
-1.087
-1.329
0.379
0.537
—
0.538
-0.883
-1.520
1.842
-0.476
-0.694
2.061
-1.779
-2.440
0.844
0.527
4483
-3516.557
-
2963.324
0.398
6062
6062..900
z-stat
10.190
4.630
1.730
2.890
3.470
3.570
10.530
7.970
什么是四轮定位-2.100
-3.240
2.950
2.850
—
-1.850
—
-2.020
—
2.140
—
4.130
-2.870
—
2.670
1.900
2.130
-1.870
-2.950
-2.940
1.990
1.890
—
1.710
嫦娥奔月传说
-5.620
-3.270
2.800
-1.860
-2.380
4.610
-2.000
-
2.060
2.080
1.800
注:MI表示受伤,SI为死亡。
217
交通运输系统工程与信息2021年6月
3.2均值异质性
均值异质性的随机参数Logit模型不仅能检测出具有随机参数的变量,还可进一步探索造成随机系数的可能原因。由表2中随机参数均值异质性的结果可知:
(1)夜间有路灯照明这一随机参数变量在柔性护栏和无安全气囊两个变量中具有均值异质性,且参数估计系数中柔性护栏为负,无安全气囊为正。这一结果表明,在夜间有路灯照明条件的情形下,若路侧防护为柔性护栏会对驾驶员起到保护作用,可降低严重伤亡等级;若驾驶车辆无安全气囊,则容易增大事故伤亡的严重程度。
(2)事故发生在夜间这一随机参数变量在行道树变量中具有均值异质性,且其参数估计系数为正,表明当事故发生在夜间时,驾驶员不能清晰地看到路侧行道树,容易增大车辆与行道树的碰撞风险,导致增大事故的伤亡程度。
(3)女性这一随机参数变量没有检测出均值异质性的变量,表明女性这一变量具有异质性,但基于本文数据还不能对其异质性进行解释,以后可考虑收集更多的相关变量数据对其异质性问题进行深入研究。
4事故严重程度影响因素分析
鉴于均值异质性的随机参数Logit模型拟合优度最优,且能较好解释各因素对事故严重程度的异质性。本文基于均值异质性随机参数Logit模型的参数估计结果,进一步计算各显著变量对事故严重程度影响的平均边际系数,具体结果如表3所示。
表32015—2019年驾驶员受伤程度的平均边际Table3Average marginal effect of driver's injury verity from2015to2019
变量名称
驾驶员特征
跑步多少公里合适车辆特征
道路特征
环境特征
女性[MI]
老年[MI]
老年[SI]
酒后驾驶[MI]
酒后驾驶[SI]
高级驾驶员[MI]
高级驾驶员[SI]
事故未处理[MI]
事故未处理[SI]
倒车[SI]
右转[SI]
左转或掉头[MI]
无气囊[SI]
安全气囊碰撞后未展开[SI]
柔性护栏[MI]
波形护栏[SI]
绿化带护栏[SI]
行道树[MI]
路表潮湿[SI]
匝道口[MI]
匝道口[SI]
晴[MI]
雨雪雾[SI]
能见度50m以下[SI]
事故发生在夜间[MI]
事故发生在夜间[SI]
夜间无路灯照明[MI]
夜间有路灯照明[MI]
夜间有路灯照明[SI]
均值异质性的随机参数Logit模型
死亡事故
-0.0014
-0.0188
0.0223
-0.2546
0.2285
0.0087
-0.0190
-0.0153
0.0181
-0.0025
-
0.0033
-0.0036
0.0188
0.0146
0.0004
0.0085
0.0065
-0.0059
-0.0123
0.0024
-0.0035
-
0.0126
0.0100
0.0068
0.0240
-0.0064
0.0073
0.0239
-0.0407
受伤事故
0.0020
0.0246
-
0.0202
0.3420
-0.2042
-0.0132
0.0163
0.0200
-0.0162
0.0021
0.0028
0.0055
-0.0163
-
0.0126
-0.0014
-0.0078
-0.0057
0.0103
0.0100
-0.0044
0.0029
0.0159
-0.0082
-0.0058
-
0.0482
0.0043
-0.0094
-0.0575
0.0246
仅财产损失
-0.0006
-0.0058
-0.0021
-0.0874
-0.0243
0.0045
0.0026
-0.0047
-0.0019
0.0004
0.0005
-0.0019
-0.0025
-0.0020
0.0010
-0.0007
-
0.0008
-0.0044
0.0023
0.0019
0.0006
-0.0033
-0.0018
-0.0011
0.0241
0.0021
0.0021
0.0336
0.0161
注:粗体值表示已定义解释变量的伤害严重性输出。218