第40卷第5期2018年9月湖北大学学报(自然科学版)
Journal of Hubei University(Natural Science)
Vol.40㊀No.5㊀Sept.,2018㊀
收稿日期:20171218
基金项目:湖北省教育厅 项目驱动的学生应用数学能力培养 项目(201511041301003)和湖北省大学生创新项目(201610512045)丁香成人电影
资助
作者简介:郭宇(1997-),女,本科生;余杨,通信作者,教授,研究方向为数学与统计建模,E-mail:yuyang@hubu.edu
文章编号:10002375(2018)05048205
香港赛马会赛马成绩的差异性分析研究
郭宇1,杨雅宁1,陶江2,余杨1
(1.湖北大学数学与统计学学院,湖北武汉430062;2.湖北大学体育学院,湖北武汉430062)
摘要:搜集和整理香港赛马会2015年9月至2016年7月和2016年9月至2017年7月共2个赛季㊁9种赛程共计1551场赛马比赛的成绩.对两个赛季相同赛程赛马成绩的差异进行独立样本T 检验,并对差异产生的原因进行分析.结果表明:两个赛季中1000m 赛程和2000m 赛程的比赛成绩无显著差异,1200m㊁1400m㊁1600m㊁1650m㊁1800m㊁
2200m 以及2400m 赛程的比赛成绩两个赛季中存在显著差异.
关键词:香港赛马会;赛马成绩;T 检验;差异
中图分类号:S821;G882.1㊀㊀文献标志码:A㊀㊀DOI :10.3969/j.issn.1000-2375.2018.05.008
Difference analysis of racing performance of Thoroughbred race hors in HongKong
GUO Yu 1,YANG Yaning 1,TAO Jiang 2,YU Yang 1
(1.School of Mathematics and Statistics,Hubei University,Wuhan 430062,China;
2.School of Physical Education,Hubei University,Wuhan 430062,China)
Abstract :Performance data on the population of Thoroughbreds racing in Hong Kong between September
2015and July 2017(n =1551)were acquired and ud to estimate the difference of racing performance in
two asons.In this study,independent sample T test was adapted to test the difference of the same distance of racing performance of 1551hors.Two conclusions in this study are:1)there were no significant differences in racing performance of 1000m and 2000m;2)there were significant differences in racing performance of安吉拉月季
1200m,1400m,1600m,1650m,1800m,2200m,2400m.
Key words :Hong Kong Jockey Club;racing performance;T -test;difference
0㊀引言
Velie B D(2015)[1]的研究表明,亚洲纯种马比赛中,不同比赛成绩的指标可用于获得马匹的遗
传及育种的优势.在遗传学中,从赛马成绩众多表现特征中选择合适的特征指标非常重要,对现有马匹
比赛成绩进行研究将有利于对以后纯种马比赛中马匹的遗传学特征和比赛成绩进行预测.Thiruvenkadan 等(2009)[2]将纯种马赛马比赛的成绩分为3类:(1)按比赛时间分类的比赛成绩有:比赛完成用时㊁最短用时㊁平均用时;(2)按不利条件或相似的比赛成绩评估依据分类:①负重②头马距离③最终排名;(3)按比赛奖金分类.对于按照比赛时间分类的赛马成绩,多位学者对世界各地的赛马比赛成绩进行了研究,Oki H 等(1996)[3]用极大似然法研究了日本赛马协会(Japan racing
第5期郭宇,等:香港赛马会赛马成绩的差异性分析研究483
万的草书㊀association,JRA)1992 1993赛季草地比赛1200m㊁1400m㊁1600m㊁1800m和2000m5个赛程比赛成绩的相关性以及1992 1993赛季泥地比赛1000m㊁1200m㊁1400m㊁1600m㊁1700m和1800 m6个赛程比赛成绩的相关性.Wilson D E等(1988)[4]研究了以比赛完成时间作为成绩指标,建立重复记录的动物模型研究美国赛马比赛的马匹遗传功能以及环境因素对比赛成绩的影响.Park J E[5]对比赛完成时间利用主成分分析(PCA)生成一个新的指标研究世界上14个地区(澳大利亚㊁新西兰㊁美国㊁日本㊁韩国㊁印度㊁加拿大㊁英格兰㊁爱尔兰㊁中国㊁法国㊁阿根廷㊁乌克兰和俄罗斯)赛马比赛中,马匹的年龄㊁负重㊁比赛天气以及比赛场地对比赛结果的影响.本文中采用比赛完成时间作为赛马比赛成绩.
不同于世界其他地方的赛马,香港赛马会的赛马比赛有其独特之处,其一在于所有参赛马匹都是进口马,其二是参赛马匹主要是在沙田进行训练[1].另外,香港赛马会的所有参赛马匹在比赛㊁训练㊁医疗
保护等方面比世界上其他地方的赛马接受更严格规范的指导.这样,香港赛马会的赛马比赛成绩不仅减少了统计模型的计算误差,同样也减少了环境因素等变量在赛马过程中对比赛成绩的影响[1].Velie B D (2015)的研究还表明,香港赛马会的赛马在跑马地的比赛平均用时要比在沙田的比赛平均用时少,并且当赛程增加时,两个比赛场地的比赛平均用时之间存在相应的有差异的增加.
本研究首先对2015 2016以及2016 2017赛季香港赛马会的赛马成绩数据进行整理,得到香港赛马会不同赛季㊁不同赛程的赛马成绩统计结果,然后用方差分析研究不同赛季㊁不同赛程的赛马成绩是否有统计学意义上的差异以及差异大小.
1 数据选择与处理
香港赛马会的一个赛季(称为马季)一般是从每年的9月初开始,到下一年的7月中旬结束,全部是纯种马速度赛马.按照赛程(比赛距离)分为短距离(1000m㊁1200m㊁1400m),中距离(1600m㊁1650m),长距离(1800m㊁2000m㊁2200m㊁2400m)等不同类别.比赛场地设在沙田和跑马地两个地方,在赛马比赛中,比赛赛道分为沙田马场草地跑道㊁沙田马场全天候跑道和跑马地马场草地跑道3种.每场比赛最多可有14(日场)或12(夜场)匹赛马参加,前六名为优胜,可以得到不同数额的奖金[6].奖金根据不同比例分给优胜马的马主㊁骑师和练马师.比赛分为在跑马地快活谷的周三夜赛,每次89场,每场12匹马参赛;在沙田马场的周日日赛,每次1011场,每
场14匹马参赛.
根据香港赛马会提供的数据,我们统计出2015年9月6日至2016年7月10日共308天内,举行了767场赛马比赛,2016年9月3日至2017年7月16日共316天内,举行了784场赛马比赛.两个赛季的参赛马匹一共有1758匹马,有88位骑马师,78位练马师参赛,两个赛季一共举行了1551场比赛.
我们选取了以下3个指标:比赛用时均值㊁每场比赛前三名比赛用时均值和最快比赛用时来分析比赛成绩.比赛用时均值能体现一个赛季的赛马成绩平均水平;每场比赛前三名比赛用时能体现一个赛季每场比赛优胜者的平均水平;而最快比赛用时则能体现出一个赛季的最佳水平.表1给出了两个赛季中不同赛程中的比赛场数㊁比赛记录数㊁参赛的马匹数和该赛季赛程中比赛用时均值㊁该赛季赛程中每场比赛前三名比赛用时及每场比赛中最快比赛用时结果.
从表1可以看出,相同赛程下不同赛季的比赛场数大致相同,每个赛季安排的各个赛程的比赛场数是近似相同的,每个赛季参赛的马匹数量不同会引起比赛场数的细微差异.9个赛程中,1000 m㊁1200m㊁1400m㊁1600m㊁1650m㊁1800m及2200m7个赛程第二赛季较第一赛季的比赛用时均值稍有减少,
说明每个赛季的比赛成绩平均略有提高.而最快比赛用时中,1000m㊁1600m㊁1650 m㊁1800m㊁2000m及2400m6个赛程中第一赛季较第二赛季稍有减少,说明整个赛季最佳成绩并没有逐年提高.
484㊀湖北大学学报(自然科学版)第40卷
表1㊀两个赛季的比赛数据和比赛成绩
赛程
/m赛季场数记录数马匹数比赛用时均值ʃ标准
差/s 每场前三比赛用时
均值ʃ标准差/s
最快比赛
用时/s
10002015 20167895942357.8002ʃ0.988757.1922ʃ0.793255.16 2016 20177794440957.7967ʃ0.865757.1830ʃ0.653455.40
12002015 2016269327188570.6639ʃ1.031070.0388ʃ0.809368.04 2016 2017284344386570.5693ʃ1.075869.9619ʃ0.715467.59
14002015 2016120159865583.2751ʃ1.129082.5874ʃ0.718980.52 2016 2017127168067783.1574ʃ1.258882.4119ʃ0.708380.31
16002015 20167091941896.0492ʃ1.254495.3439ʃ1.041993.22 2016 20175571133895.7232ʃ1.174795.0348ʃ0.751493.48
凉拌肉的做法
16502015 20161301574516101.6724ʃ1.5185101.0058ʃ1.235296.34 2016 20171401684544101.0778ʃ1.8687100.3575ʃ1.123697.62
18002015 201668854322110.3772ʃ2.0811109.6498ʃ1.6328105.83 2016 201764785297110.1097ʃ1.9551109.3088ʃ1.3869106.98
20002015 201618230150123.4202ʃ1.6198122.5756ʃ1.2538120.21 2016 201720224126123.6560ʃ1.5645123.7201ʃ1.5214120.41
22002015 20161113390138.8160ʃ2.3412137.7842ʃ1.7626132.84 2016 20171416392137.9252ʃ2.1381137.1029ʃ1.8737132.42
24002015 201633025149.1113ʃ1.6863148.2689ʃ1.6688146.18 2016 201733238148.1488ʃ1.6072147.2844ʃ1.8041145.48
2㊀差异性检验方法
统计学中,独立样本T检验可以检验两个总体均值是否显著差异,进行独立样本T检验的过程中,还需验证方差是否齐性(方差相等).为了比较不同赛季中相同赛程的赛马比赛成绩有无差异,我们对表1中的数据做独立样本T检验,推断两个赛季相同赛程的比赛成绩是否存在显著差异.给定显著性水平α=0.05,统计检验步骤如下:(1)利用F检验判断两个赛季赛马成绩的方差是否相等.若F检验统计量的概率p值小于显著性水平α,认为两个赛季赛马成绩的方差有显著差异(即方差不等);进一步,在方差不等假设下,进入步骤(2).否则,在方差相等假设下,进入步骤(2).(2)用T检验判断总体均值是否存在显著差异.如果T检验统计量的概率p值小于显著性水平α,认为两个赛季赛马成绩总体均值有显著性差异,否则,认为两个赛季赛马成绩总体均值没有显著性差异.
不同赛季中相同赛程的比赛成绩的F检验和T检验结果见表2.
表2㊀比赛用时均值、每场比赛前三名比赛用时均值和最快比赛用时T检验结果
比赛用时均值每场比赛前三名比赛用时均值最快比赛用时
端午节是什么时候
距离F Sig.t Sig.F Sig.t Sig.F Sig.t Sig. 1000m方差相等 3.300.070.400.69 1000m方差不等13.2500.080.939.8600.140.89
1200m方差不等7.610.01 3.68018.780 2.050.047.780.011.170.24 1400m方差相等 2.510.11 2.940 2.510.11 2.9400.030.862.050.04 1600m方差相等0.060.80 3.350
1600m方差不等14.430 5.390 6.710.011.730.09 1650m方差相等0.010.929.9300.790.387.8200.560.464.560 1800m方差相等00.96 2.540.01 2.030.161.510.13 1800m方差不等8.900 2.250.03
2000m方差相等 2.190.14-1.580.120.030.85-5.1100.080.79-1.080.29 2200m方差相等0.130.72 3.4200.030.87 1.600.110.020.890.960.35 2400m方差相等0.210.65 2.230.030.180.67 1.200.250.110.750.730.51
第5期郭宇,等:香港赛马会赛马成绩的差异性分析研究485
㊀两个赛季不同赛程每场最快比赛用时均值差独立样本T 检验结果表明:最快比赛用时,1000m 赛程㊁1200m 赛程㊁1600m 赛程㊁1800m 赛程㊁2000m 赛程2200m 赛程和2400m 赛程的最快比赛用时无显著差异;其余赛程,1400m 赛程和1650m 赛程,两个赛季最快比赛用时有显著差异.其中1400m 赛程,最快比赛用时成绩提高了0.1857s,1650m 赛程,最快比赛用时提高了0.6668s.
两个赛季不同赛程每场前三名的比赛用时均值差独立样本T 检验结果表明:每场前三名的比赛用
时均值,1000m㊁2200m 和2400m 赛程,两个赛季前三名的比赛用时均值无差异;其余赛程,1200m㊁1400m㊁1600m㊁1650m㊁1800m 及2000m,两个赛季前三名的比赛用时均值有显著差异.其中1200m㊁1400m㊁1600m㊁1650m㊁1800m 及2000m 每场前三名的比赛用时均值分别减少了0.0769s㊁
0.1755s㊁0.3091s㊁0.6483s㊁0.3410s 及0.6813s.
两个赛季不同赛程比赛用时均值差独立样本T 检验结果表明:比赛用时均值,1000m 和2000m
赛程,两个赛季比赛用时均值无差异;其余赛程,1200m㊁1400m㊁1600m㊁1650m㊁1800m㊁2200m 以及2400m,两个赛季比赛用时均值有显著差异.其中1200m 赛程比赛用时均值第二赛季比第一赛季减少0.0946s;1400m 赛程比赛用时均值第二赛季比第一赛季减少0.1177s;1600m 赛程比赛用时均值第二赛季比第一赛季减少0.3260s;1650m 赛程比赛用时均值第二赛季比第一赛季减少0.5946s;
1800m 赛程比赛用时均值第二赛季比第一赛季减少0.3884s;2200m 赛程比赛用时均值第二赛季比第一赛季减少0.8908s;2400m 赛程比赛用时均值第二赛季比第一赛季减少0.9626s.
3 两个赛季相同赛程比赛结果的差异分析
对不同赛程赛马比赛结果进行差异分析,英国和韩国学者已经有过相关研究.Sharman P,Wilson A
J(2015)[7]用一般线性模型(GLM)对英国1997 2012年所有比赛不同赛程的比赛获胜结果进行研究
,图1㊀最快比赛用时㊁每场比赛前三名比赛用时均值和比赛用时均值差异图
㊀
结果表明,短距离比赛的最快速度提高了0.11%,中㊁长距离比赛的最快速度分别变化了0.02%和-0.009%.Cho K H,Son S K,
(2008)[8]等建立了线性回归和二次回归方程研究韩国赛马协会1994 1996年间不同赛程(1000m,1200m,1400m,1700m,1800m,1900m,2000m)比赛中马匹重量对比赛时间的影响,他们的研究表明:马匹重量改变20kg 相对于改变5kg,比赛时间增加0.3s.
图1描述了两个赛季,不同赛程的比赛用时均值㊁每场比赛前三名比赛用时均值和最快比赛用时.
图1中矩形条的高度代表 记录数 ,表示参赛马匹的参赛记录数,每一小线段的底部刻度代表 最快比赛
用时 表示参赛马全程用时最少的时间记录,代表一场比赛的最好成绩,每一小线段的中部刻度代表 每场比赛前三名比赛用时均值 表示参赛马匹前三名比赛用时的均值,代表一场比赛获奖等级的比赛成绩,每一小线段中的顶部刻度代表 比赛用时均值 表示所有参赛马匹比赛用时的平均值,代表一场比赛的平均水平.从图1中可看出,短距离赛程1200m 的参赛马匹数最多,短距离赛程1400m㊁中距离赛程1650m 的参赛马匹也较多,长距离赛程2400m 的参赛马匹最少.茶尺蠖
千年游
486㊀湖北大学学报(自然科学版)第40卷
从图1可以看出,每一场比赛中,每场比赛前三名比赛用时均值和比赛用时均值之间的差异较小,表明一场比赛中,获奖等级的马匹竞争非常激烈;随着赛程距离的增加,每一场比赛的比赛用时均值与最快比赛用时之间的差异也随之增加,这表明随着比赛距离的增加,每一场比赛中顶尖马匹与其余参赛马匹的比赛用时之间差异也在增加,短距离比赛中每一场比赛中顶尖马匹与其余参赛马匹的比赛用时之间差异较小,长距离比赛中每一场比赛中顶尖马匹与其余参赛马匹的比赛用时之间差异较大.这个结果与Velie B D(2015)[1]的研究结果有相同之处.2016 2017赛季的最快比赛用时与比赛平均用时差距较上一个赛季小,说明比赛的竞争越来越激烈.
两个赛季的最快比赛用时中,除了1400m和1650m赛程的成绩有显著差异,1000m赛程㊁1200 m赛程㊁1600m赛程㊁1800m赛程㊁2000m赛程2200m赛程和2400m赛程的最快比赛用时均无显著差异.究其原因,我们发现两个赛季中,马匹出场重复比例㊁骑马师和练马师重复比例较大,例如第一个赛季中参加了1000m比赛的马匹占第二个赛季1000m比赛的马匹数的41.32%,骑马师占13.95%,练马师占31.81%;第一个赛季中参加了2000m比赛的马匹占第二个赛季2000m比赛的马匹数的47.62%,骑马师占72.22%,练马师占85.71%.因此两个赛季中大部分赛程的最快比赛用时没有显著差异的.
4㊀结论
两个赛季的最快比赛用时中,除了1400m和1650m赛程的成绩有显著差异,其余赛程最快比赛用时无显著差异,最快比赛用时中,1000m㊁1600m㊁1650m㊁1800m㊁2000m及2400m6个赛程中第一赛季较第二赛季稍有减少,说明整个赛季最佳成绩并没有逐年提高.两个赛季每场前三名的比赛用时均值中,1000m㊁2200m和2400m赛程前三名的比赛用时均值无差异,其余赛程每场前三名的比赛用时均值2016 2017赛季较上一个赛季成绩有所提高.两个赛季的比赛用时均值中,1000m和2000m 赛程的比赛用时均值无差异,1200m㊁1400m㊁1600m㊁1650m㊁1800m㊁2200m和2400m等7个赛程第二赛季较第一赛季的比赛用时均值稍有减少,说明2016-2017赛季的比赛成绩略有提高.
总之,从比赛整体平均水平看,两个赛季中1000m赛程和2000m赛程的比赛用时均值无显著差异,其余1200m㊁1400m㊁1600m㊁1650m㊁1800m㊁2200m以及2400m的比赛用时存在显著差异;从比赛顶尖水平看,除了1400m和1650m赛程的成绩有显著差异,其余赛程的最快比赛用时无显著差异.
5㊀参考文献
[1]Velie B D,Hamilton N A,Wade C M.Performance lection for Thoroughbreds racing in Hong Kong[J].Equine Veterinary Journal,2015,47(1):43-47.
[2]Thiruvenkadan A K,Kandasamy N,Panneerlvam S.Inheritance of racing performance of Thoroughbred hors[J]. Livestock Science,2009,121(2):308-326.
[3]Oki H,Sasaki Y.Estimation of genetic trend in racing time of thoroughbred hor in Japan[J].Animal Science& Technology,1996,67(2):120-124.
[4]Wilson D E,Willham R L,Buttram S T,et al.Genetics of racing performance in the American Quarter Hor.I. evaluation using a reduced animal model with repeated records[J].Journal of Animal Science,1988,66(11):751-768.
芙蓉谷
[5]Park J E,Lee J R,Oh S,et al.Principal components analysis applied to genetic evaluation of racing performance of Thoroughbred race hors in Korea[J].Livestock Science,2011,135(2):293-299.
[6]The Hong Kong Jockey Club(2012).Rules of racing and instructions2011 2012,The Hong Kong Jockey Club,Hong Kong,China.
[7]Sharman P,Wilson A J.Racehors are getting faster[J].Biology Letters,2015,11(6):314-332.
[8]Cho K H,Son S K,Cho B W,et al.Effects of change of body weight on racing time in thoroughbred racehors[J]. Journal of the Korean Data&Information Science Society,2008,50(6):741-746.
(责任编辑㊀赵燕)