出租车GPS轨迹数据挖掘应用研究进展
摘要:在出租车的运营过程中,产生和积累了大量的GPS轨迹数据。出租车轨迹数据不仅反映出租车的行驶路线,同时也是城市交通状态与城市结构规划的一种数据映射,其中蕴含着丰富的信息,对城市的智能交通、智慧城市规划有着非常重要的意义。文章综述了近十年国内外出租车轨迹数据挖掘应用的相关研究,从个性化路径规划、城市规划和改善出租车服务三方面阐述其研究现状,并对出租车轨迹数据挖掘应用所面临的挑战以及未来的研究前景进行了探讨。
关键词:GPS;出租车轨迹;数据挖掘:路径规划
中图分类号:G434 文献标识码:A 文章编号:1006-8228(2020)08-79-03
0引言
随着GPS定位技术的普及,各大城市的出租车上都安装了GPS,以实现对车辆的实时追踪、管理和调度。在出租车的日常运营中,产生和积累了大量的GPS轨迹数据。这些数据中蕴含大量的有用信息,有效的对轨迹数据进行挖掘、分析能获得潜在的巨大应用价值。
當前,出租车GPS轨迹数据已被城市计算、智能交通等众多研究领域进行研究,用于感知城市交通信息[1-2],发现人们出行活动规律[3-4]等信息,以提高公共资源利用率,解决交通拥堵和环境污染等许多大城市面临的重大问题,其利用价值可以惠及个人、组织和社会。文献[5]对2019年前出租车轨迹数据挖掘技术进行了比较全面的综述。本文将根据出租车轨迹数据挖掘的应用的个性化路径规划、城市规划、改善出租车服务三方面对现有的研究成果进行阐述,以期为出租车轨迹数据挖掘应用等相关领域学者提供参考。
1 个性化路线规划
好的路线推荐系统应该结合实时路况与用户偏好,为用户推荐到达目的地的最佳路线。出租车的GPS轨迹恰好能够记录出租车的路线选择行为,为获取出租车司机积累的路况知识和路径选择经验提供了便利的途径。所以,通过挖掘出租车GPS轨迹数据获得的相关知识,可以帮助我们改善现有的路线推荐方法,为用户推荐最快路径[6]。
戚欣等[7]针对传统的路径规划算法并不一定能计算得到现实中最优路径的问题,提出一种融合了出租车驾驶经验并以时间为度量的路径规划算法。袁晶等[8]基于大规模出租车历史轨迹挖掘设计了最快路线推荐系统T-Drive。该系统首先从历史出租车轨迹数据中学习出租车司机的路径选择知识并将之表示成一个地标图。然后,基于学习的地标图分两步骤计算给定起点和终点的最快路径。随后,袁晶等[9]提出了较T-Drive更加完善的快速路线推荐系统,该系统结合当前交通状况和历史知识实现路况预测,综合考虑了天气因素,增加了对用户驾驶习惯的学习功能,能够更好、更个性化地为用户规划最快路线。
Chen等[10]利用出租车轨迹数据和基于位置的社交网络数据构建了一个实现个性化、能感知路况的交互式路线规划系统。该系统首先从出租车轨迹和基于位置的社交网络数据中提取出动态的兴趣点网络模型,然后采用两阶段方法进行个性化路径规划。Yang等[11]基于大规模车辆的GPS轨迹数据分析建立了MTUG图模型,并基于该图模型提出随机Skyline路径规划算法,在最优路径的寻找过程中综合考虑多个开销因素,进而实现绿色路径规划。
2 城市规划
通过挖掘大规模出租车轨迹历史数据在智慧城市规划方面也发挥着越来越重要的作用。例如通过分析轨迹数据中出租车绕路、低速行驶等现象,可反映出目前交通规划中的不足[12]。Qi[15]等通过对出租车上下客地点的挖掘和聚类分析,可帮助揭示城市居民的日常活动模式和城市区域的地块使用情况和功能划分[13-15]。Zhang等[16]利用大规模出租车轨迹数据检测城市中社会事件的发生时间、地点,进而评估社会事件的发生的规模及其对周边交通的影响,即社会事件的规模与交通拥堵之间是否存在联系。Qian等[17]对出租车行程与城市居民活动的一致性进行了研究,利用两步聚类算法分析出租车行程的内在相似性,进而揭示下客地点的内在联系。Cai等[18]基于出租车轨迹数据分析提出城市热点区域吸引力指数的量化模型,用于进一步分析城市热点区域形成的差别。Ge等[19]提出一种城市用地分类的统一框架,该框架融合了从大规模出租车轨迹数据中提取的多维居民活动特征。
3 出租车服务改善
通过挖掘大规模出租车历史GPS轨迹数据可以为出租车司机推荐寻客路线,为乘客推荐最佳的打车地点,同时也可解决出租车调度平衡性等问题。Yang等[20]针对城市出租车供求不平衡问题,提出了基于学习算法的出租车调度模型,预测不同区域不同时段出租车的需求,已达到提前调度出租车。Qu等[21]设计了一款推荐系统,该系统能够通过挖掘出租车历史GPS轨迹为司机推荐收益最大化的寻客路线。Tang等[22]利用大量出租车历史轨迹数据分析出租车司机在载客和空乘状态下的行为,该研究结果可以用于改善出租车服务。Miao等[23]踟为出租车公司设计了一款空车调配系统,通过分析出租车的历史轨迹、实时载客状态数据和实时轨迹数据构建需求模型,以达到最小化出租车空乘行驶路程的目的。Zhang等[24]通过挖掘出租车GPS轨迹数据来从寻客策略、送客路径选择策略和服务区域偏好三个方面分析出理解经验丰富的出租车司机的服务策略,进而揭示高效和低效的服务策略。Zhan等[25]利用大规模的出租车行程数据系统性地分析了城市出租车系统的服务效率,他们得出结论:在出租车司机和乘客信息共享的前提下,出租车的空乘率可以降低60% -90%。
4 结束语
本文从个性化路径规划、城市规划、改善出租车服务三方面对出租车轨迹数据挖掘的研究现状进行了较为深入的梳理与分析。目前出租车轨迹数据挖掘所存在的主要问题有:①缺乏对大规模轨迹数据的有效管理方法和轨迹数据质量管理评估方法的研究;②现有研究成果大都停留在理论层面,尚未有广泛实际的应用;③出租车轨迹数据仅是城市交通轨迹数据中的一部分,需融合其他类型的数据,例如:城市路网分布、公交车、行人轨迹等数据,才能更好地反映城市规划布局现状。后续,我们将针对目前出租车轨迹数据挖掘研究所存在的问题,进行深入研究,主要包括:智能化的轨迹数据质量管理和预处理技术研究,以及基于多源数据融合的路径规划和城市规划。 参考文献(References):
[1]J. Yu,M.E.J.Stettler,P.Angeloudis,S.Hu, and X.(Michael) Chen. Urban netxvork-wide traffic speedestimation with massive ride-sourcing GPS traces[Jl.Transp. Res.Part C Emerg. Techn01.,2020.112:136-152
[2]J. Wang,R.Chen, and Z.He. Traffic speed prediction forurban transportation network: A path based deeplearning approach[Jl. Transp. Res. Part C Emerg.Technol.. 2019.100: 37 2- 385
[3]X. Gong,Z.Huang,Y.Wang,L.Wu, and Y.Liu. High-performance spatiotemporal trajectory matching across heterogeneous data sources[J]. Future Gener. Comput.Syst,2019.105:148-161
[4] C. Siddique and X. (Jeff) Ban. State-dependent self-adaptive sampling (SAS) method for vehicle trajectorydata. Transp[J]. Res. Part C Emerg. Techn01,2019.100:224-237
[5]吴华意 ,黄蕊 ,游兰,向隆刚 .出租车轨迹数据挖掘进展[J].测绘学报,2019.48(11):1341-1356
[6] Y. Qiu, X. Xu, and F. Xia. “An Optimal Profit RoutePlanning Scheme Based on ACO-OPP,” in 2019 IEEE2lst Intemational Conference on High PerformanceComputing and Communications[C]. New York, NY,USA.2019:766-773
[7]戚欣,梁偉涛,马勇,基于出租车轨迹数据的最优路径规划方法 [J]计算机应用 ,2017.37(7):2106-2113
[8] J. Yuan et al., “T-drive: Driving Directions Based on TaxiTrajectories,” in Proceedings of the 18th SIGSPATIALInternational Conference on Advances in GeographicInformation Systems[C], New York, NY, USA, 2010:99-108
[9] J. Yuan, Y. Zheng, X. Xie, and G. Sun, “Driving withKnowledge from the Physical World, ” in Proceedingsof the 17th ACM SIGKDD International Conferenceon Knowledge DiscoveW and Data Mining[C]. NewYork, NY, USA,2011:316-324
[10] C. Chen, D. Zhang, B. Guo, X. Ma, G. Pan, and Z. Wu.TripPlanner: Personalized Trip Planning LeveragingHeterogeneous Crowdsourced Digital Footprints[J]. IEEErans. Intell. Transp. Syst.,2015.16(3):1259-1273
[11] B. Yang, C. Guo, C. S. Jensen, M. Kaul, and S. Shang,”Stochastic skyline route planning under time-vaWinguncertainty,” in Proceedings of the 2014 IEEE 30thInternational Conference on Data Engineering[C].NewYork, NY, USA,2014:136-147
[12] Y. Zheng, Y. Liu, J. Yuan, and X. Xie, “UrbanComputing with Taxicabs,” in Proceedings of the 13thInternational Conference on Ubiquitous Computing[C],New York, NY, USA,2011:89-98
[13] G. Qi, X. Li, S. Li, G. Pan, Z. Wang, and D. Zhang,”Measuring social functions of city regions fromlarge-scale taxi behaviors,”in 2011 IEEE InternationalConference on Pervasive Computing and Commum-cations Workshops (C), New York, NY, USA, Mar,2011:384-388 [14] J. Yuan, Y. Zheng, and X. Xie, “Discovering Regions ofDifferent Functions in a City Using Human Mobilityand POls, ” in Proceedings of the 18th ACMSIGKDD International Conference on KnowledgeDiscovery and Data Mining[C]. New York, NY, USA,2012 :186-194
[15] G. Pan, G. Qi, Z. Wu, D. Zhang, and S. Li, Land-Use Classification Using Taxi GPS Traces[J]. IEEE Trans.Intell. Transp. Syst.,2013.14(1):113-123
[16] W. Zhang, G. Qi, G. Pan, H. Lu, S. Li, and Z. Wu. City-Scale Social Event Detection and Evaluation with TaxiTraces[J].ACM Trans Intell Syst Techn01,2015.6(3).
[17] X. Qian, X. Zhan, and S. V. Ukkusuri, “CharacterizingUrban Dynamics Using Large Scale Taxicab Data,”in Engineering and Applied Sciences Optimization,N. D. Lagaros and M. Papadrakakis, Eds. SpringerInternational Publishing[C],New York, NY, USA,2015:17-32
[18] 1. Cai, F. Jiang, W. Zhou, and K. Li. Design andApplication of an Attractiveness Index for UrbanHotspots Based on GPS Trajectory Data[J]. IEEEAccess,2018.6:55976-55985
[19] P. Ge, J. He, S. Zhang, L. Zhang, and J. She. AnIntegrated Framework Combining Multiple HumanActivity Features for Land Use Classification[J].ISPRS Int. J. Geo-Inf.,2019.8(2):90
[20] Y. Yang, X. Wang, Y. Xu, and Q. Huang. MultiagentReinforcement Learning-Based Taxi PredispatchingModel to Balance Taxi Supply and Demand[J]. J.Adv. Transp,2020.2:1-12
[21] M. Qu, H. Zhu, J. Liu, G. Liu, and H. Xiong, “A Cost-effective Recommender System for Taxi Drivers,” inProceedings of the 20th ACM SIGKDD IntemationalConference on Knowledge DiscoveW and Data Mining[C].New York, NY, USA,2014:45-54
[22] J. Tang, H. Jiang, Z. Li, M. Li, F. Liu, and Y. Wang.ATwo-Layer Model for Taxi Customer SearchingBehaviors Using GPS TrajectoW Data[Jl.IEEE Trans.Intell. Transp. Syst.,2016.99:1-7
[23] F. Miao et aL Taxi Dispatch With Real-Time SensingData in Metropolitan Areas: A Receding HorizonControl Approach[J]. IEEE Trans. Autom. Sci. Eng.,2016.13(2):463-478
[24] D. Zhang et aL Understanding Taxi Service StrategiesFrom Taxi GPS Traces[J]. IEEE Trans. Intell. Transp.Syst. , 2015.16(1):123-135
[25] X. Zhan, X. Qian, and S. V. Ukkusuri.A Graph-BasedApproach to Measuring the Efficiency of an UrbanTaxi Service System[J]. IEEE Trans. Intell. Transp.Syst,2016.99:1-II.
基金项目:浙江省教育厅课题“基于大规模出租车GPS轨迹的城市交通拥堵事件发现方法研究”(Y201941364)
作者簡介:杨琼(1982-),女,湖南湘西人,在读博士,主要研究方向:数据挖掘,数据安全,机器学习。
“张承辉博客” 出租车GPS轨迹数据挖掘应用研究进展 https://www.zhangchenghui.com/80925