基于手机信令数据的居住和出行特征分析——以深圳市为例

更新时间:2023-08-01 09:57:16 阅读: 评论:0

Hans Journal of Data Mining 数据挖掘, 2018, 8(4), 162-173
Published Online October 2018 in Hans. www.hanspub/journal/hjdm
doi/10.12677/hjdm.2018.84018
Residential and Travel Characteristics
Analysis Bad on Mobile Phone Signaling
Data
—A Ca in Shenzhen City
Jiandong Qiu1, Qingya Lin1*, Qiang Li2
1Shenzhen Urban Transport Planning Center Co., Ltd., Shenzhen Guangdong
2Traffic Information Engineering & Technology Rearch Center of Guangdong Province, Shenzhen Guangdong
Received: Aug. 20th, 2018; accepted: Sep. 5th, 2018; published: Sep. 12th, 2018
Abstract
名言警句英语There is no obvious tendency for the data of mobile phone signaling data to be objective, compre-hensive and sampling. The data has strong spatiotemporal continuity and can be obrved in the whole process of traffic travel, which is unmatched by any other data source. Using mobile phone signaling data to analyze the characteristics of urban traffic operation makes up for long cycle of the traditional traffic survey, heavy workload, small sample size and high cost. This paper studies the u of space-time information of mobile signaling data to visualize and analyze the characte-ristics of urban traffic travel. The analysis shows that there is still a strong job-commuting attrac-tion in the original SAR and the SEZ; most people live in Dongguan, Huizhou, working in Shenzhen.
Living and employment are basically at the junction of the city. Early peak of travelling shows a clear east-west, north-south formation. Analyzing the results provides a reliable basis for trans-port planning and operations.
Keywords
Cell Phone Signaling Data, Data Quality Inspection, Big Data Analysis, Visualize女士正装
基于手机信令数据的居住和出行特征分析
——以深圳市为例
丘建栋1,林青雅1*,李强2
*通讯作者。
中老年衣服>中哈原油管道丘建栋 等配裙子穿的鞋子
1深圳市城市交通规划设计研究中心有限公司,广东 深圳 2
广东省交通信息工程技术研究中心,广东 深圳
收稿日期:2018年8月20日;录用日期:2018年9月5日;发布日期:2018年9月12日
手机信令数据样本量大、数据客观、全面、采样不会有很明显的倾向性,且数据具有较强的时空持续性,可以观测到交通出行整个过程,是任何其它数据源无法比拟的。用手机信令数据分析城市交通运行特征,弥补了传统的交通调查周期性长、工作量大、样本量少和花费高的特点。本文研究利用手机信令数据的时空信息,对城市交通出行特征进行可视化和科学分析,分析结果显示,原特区内与特区外仍有较强职住通勤吸引;住在东莞、惠州,职在深圳的人,居住和就业位置基本在城市间交界地带;早高峰出行形成明显东西向、南北向通道。分析所得结果可为交通规划和运营部门提供可靠的依据。
关键词
手机信令数据,数据质量检查,大数据分析应用,可视化
Copyright © 2018 by authors and Hans Publishers Inc.
This work is licend under the Creative Commons Attribution International Licen (CC BY). creativecommons/licens/by/4.0/
1. 引言
目前,中国城市化进程仍处在快速演变阶段,城市建设步伐加快,城市用地规模不断加大,城市人口不断攀升,城市居民的时空出行范围进一步扩展,所面临的交通问题越来越严重[1]。作为城市居民生活与生产的两大载体,“居住”与“就业”是城市空间结构中的两个核心内生变量,它们彼此依存、互相影响,两者是否均衡发展是影响城市居民生活幸福指数的关键指标,制约城市可持续发展的重要因素[2]。
传统的数据获取方法局限性明显。作为新兴的研究方向——手机信令数据,一方面,手机用户群体数量和手机使用率的不断提高,保证了手机信令数据的样本数量和随机性特征[3];另一方面,无线通信网络覆盖区域的不断扩大,使得手机信令数据的时空信息具备时间连续性和空间广覆盖性等优点[4]。
本文基于手机数据,从多个层面上对深圳市居民活动与空间环境间的复杂关系做更加精细与全面的描
述与解析,重点关注城市居民的职住分布、城市空间的流动性与相互作用机制,以及特定场景、特定人群的空间活动特征,开展深莞惠区域城市群落居民居住和就业空间关系及往来联系强度研究,对推动就业与居住均衡发展,把握城市发展规划,促进居住空间与产业空间拓展的联动与共赢显得非常必要。
2. 停留和出行地识别算法
2.1. 数据概述
数据来源于深圳市城市交通规划设计研究中心有限公司——未来交通实验室。一共有2017年11月12日到2017年11月25日(共14天)的数据,其中工作日有10天。数据空间范围为深圳、东莞和惠州这
丘建栋 等
三个城市的全域。本文主要分析深圳居民交通出行时空变化和深莞惠市域间的职住关系。手机信令数据包含的信息如下,见表1所示。
2.2. 人口类型划分
本次研究通过人口的停留日期、时间和位置总体上将人口划分为两大类型(见图1):常住人口(停留时间超过7小时/天的、天数大于等于50%天)以及非常住人口。常住人口又分为常驻人员和固定设备,其中定位位置一直不变的识别为固定设备;非常住人口中所有出现的日期里,停留时间均少于3个小时的识别为过境人员,其他为流动人员。
2.3. 居住地和工作地识别
居住地的判别依据为0~8点、19~24点停留时间最长的基站为居住基站。9~18点停留时间最长的基站,且在基站周围500米范围内停留时间大于4小时、天数大于等于50%天的为工作地基站。
2.4. 出行识别
首先,按500米的距离对个体出行的轨迹点进行空间聚合,将停留时间超过30分钟的点作为一次停留活动点,两个相邻活动点为一次出行,一天中的第一个活动点和最后一个活动点也作为一次出行,这样可得到用户一天的出行链轨迹及出行次数和出行时间。
Figure 1. Ur type division 图1. 人口类别划分
Table 1. Description of Mobile phone signaling data field 表1. 手机信令数据字段说明
序号 字段名称 说明
1 用户ID F14BE1E7E64922F873B889ED15FD900A
2 时间 2016-09-11 08:12:24
3 基站大区 990
4 4 基站小区 76,060,311
5 经度 114.6627 6
纬度
23.6428
丘建栋等2.5. 数据分析流程
本文通过对比每天的手机信令数量,分析数据的接收质量情况,选取接收数据较稳定的日期用于后续的数据处理。数据分析流程见图2,数据处理过程中剔除有杂质的数据,将Python语言编译的算法部署于Spark平台上,通过人口类别的划分、居住地、工作地和出行识别,计算得到相应的中间表,中间表存放于postgis数据库中,用于后续应用层做分析时调用计算,应用层通过Arcgis和Transcad将计算结果进行可视化。
3. 数据质量检查
现今,手机信令数据已经被广泛应用于城市的交通特征出行分析,但是,不同的人清洗数据的算法、阈值设置都不一样。为了保证算法的可靠性,需要对清洗的数据进行数据质量检验。主要验证手机基站手机数据是否缺失,居住地和工作地识别、出行识别算法是否正确。大致的检验过程如下:用手机数据的人口数与已有的数据进行比较,判别居住地和工作地识别算法的结果是否可靠;计算每小时的出行数量,从而找出数据收集比较稳定的日期作为后面出行特征分析;计算手机数据的早高峰OD,用于与宏观模型的早高峰出行OD对比,检查出行识别算法的正确性。
3.1. 人口分布比较
考虑到手机数据中的人口不是全样数据,这里用各区人口数量占总人口比重进行比较。比较结果显示(图3),不管是与宏观模型数据还是统计年鉴数据比较,误差最大不超过5%,误差最大的行政区为福
田,可能原因是福田、罗湖区原本发展程度已达到饱和,且深圳原关外地区近年来建设用地不断扩大、交通路网不断完善、居民出行更加方便、配套设施逐渐齐全、居民的择居选择受就业岗位地理位置的制约力下降,人们很多会选择居住在原关外。
对抗心理Figure 2. Process of data analysis
元宵节的歌
图2.数据分析流程百合雪梨汤
丘建栋等
Figure 3. Population distribution of mobile data compare with macro-models and statistical yearbook
图3. 手机数据与宏观模型和统计年鉴人口分布比较
3.2. 早高峰OD比较
与宏观模型(2014年)比较结果如图4所示,最大流量通道基本相似,特别是南部几个大区之间的关联度,连接宝安、南山、福田和罗湖的通道联系强度基本一致;龙华到南山和福田、龙岗到罗湖和龙华的联系关系也一样紧密。
3.3. 早高峰OD与职住对比
职住期望线和早高峰出行对比见表2和图5,两者的行政区之间的联系非常相似,宝安–南山的关联度最强,然后是龙华–龙岗的联系度次之。
根据数据质量检查结果得出,区级别的职住和早高峰的OD基本符合实际情况。但可以从中选择出符合分析要求的日期用于本文研究。
4. 大数据分析应用
本次分析分职住分布和出行特征分析两大模块。居住和就业是人们比较关心的两大民生问题,基于手机信令数据和基站位置信息,从不同层面上分析居住地就业岗位分布、区域的职住关联、兴趣点客流来源去向分布、居民的时空出行分布、TAZ间OD客流空间分布以及客流来源空间分布。通过手机信令数据的采集、处理和分析,可以获得城市的人口分布的动态信息,可以为交通规划提供详细、实时的
人口分布信息,并可以避免因人工调查带来的各种弊端,如成本较高、抽样样本有限等。
4.1. 职住分布
4.1.1. 居住和就业密度分布
居住和就业密度分布见图6中区层面上人口主要集中在福田中心区、粤海、龙华;深圳市行政区居住人口占比中,宝安所占比例最高,为30%。
岗位密集区主要是福田区的南园、华强北、园岭,罗湖区的东门、南湖、桂圆以及南山区的粤海。
深圳市行政区岗位占比中,宝安所占比例最高,为33%。

本文发布于:2023-08-01 09:57:16,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/89/1104233.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   出行   手机   信令   空间
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图