公交车GPS数据处理

transbigdata.busgps_arriveinfo(data, line, stop, col=['VehicleId', 'GPSDateTime', 'lon', 'lat', 'stopname'], stopbuffer=200, mintime=300, project_epsg=2416, timegap=1800, method='project', projectoutput=False)

输入公交GPS数据、公交线路与站点的GeoDataFrame,该方法能够识别公交的到离站信息

输入

dataDataFrame

公交GPS数据,单一公交线路,且需要含有车辆ID、GPS时间、经纬度(wgs84)

lineGeoDataFrame

公交线型的GeoDataFrame数据,单一公交线路

stopGeoDataFrame

公交站点的GeoDataFrame数据

colList

列名,按[车辆ID,时间,经度,纬度,站点名称字段]的顺序

stopbuffernumber

米,站点的一定距离范围,车辆进入这一范围视为到站,离开则视为离站

mintimenumber

秒,短时间内公交再次到站则需要与前一次的到站数据结合一起计算到离站时间,该参数设置阈值

project_epsgnumber

匹配时会将数据转换为投影坐标系以计算距离,这里需要给定投影坐标系的epsg代号

timegapnumber

秒,清洗数据用,多长时间车辆不出现,就视为新的车辆

methodstr

公交运行图匹配方法,可选’project’或’dislimit’; project为直接匹配线路上最近点,匹配速度快; dislimit则需要考虑前面点位置,加上距离限制,匹配速度慢。

projectoutputbool

是否输出投影后的数据

输出

arrive_infoDataFrame

公交到离站信息

transbigdata.busgps_onewaytime(arrive_info, stop, start, end, col=['VehicleId', 'stopname'])

输入到离站信息表arrive_info与站点信息表stop,计算单程耗时

输入

arrive_infoDataFrame

公交到离站数据

stopGeoDataFrame

公交站点的GeoDataFrame数据

startStr

起点站名字

endStr

终点站名字

colList

字段列名[车辆ID,站点名称]

输出

onewaytimeDataFrame

公交单程耗时