数据聚合集计¶
数据集计¶
-
transbigdata.
dataagg
(data, shape, col=['Lng', 'Lat', 'count'], accuracy=500)¶
数据集计至小区
输入
- dataDataFrame
数据
- shapeGeoDataFrame
小区
- colList
可传入经纬度两列,如[‘Lng’,’Lat’],此时每一列权重为1。也可以传入经纬度和计数列三列,如[‘Lng’,’Lat’,’count’]
- accuracynumber
计算原理是先栅格化后集计,这里定义栅格大小,越小精度越高
输出
- aggresultGeoDataFrame
小区,其中count列为统计结果
- data1DataFrame
数据,对应上了小区
OD集计¶
-
transbigdata.
odagg_grid
(oddata, params, col=['slon', 'slat', 'elon', 'elat'], arrow=False)¶
OD集计与地理信息生成(栅格)。输入OD数据(每一行数据是一个出行),栅格化OD并集计后生成OD的GeoDataFrame
输入
- oddataDataFrame
OD数据
- colList
起终点列名,[‘slon’,’slat’,’elon’,’elat’],此时每一列权重为1。 也可以传入权重列,如[‘slon’,’slat’,’elon’,’elat’,’count’]
- paramsList
栅格参数(lonStart,latStart,deltaLon,deltaLat),分别为栅格左下角坐标与单个栅格的经纬度长宽
- arrowbool
生成的OD地理线型是否包含箭头
输出
- oddata1GeoDataFrame
集计后生成OD的GeoDataFrame
-
transbigdata.
odagg_shape
(oddata, shape, col=['slon', 'slat', 'elon', 'elat'], params=None, round_accuracy=6, arrow=False)¶
OD集计与地理信息生成(小区集计)。输入OD数据(每一行数据是一个出行),栅格化OD并集计后生成OD的GeoDataFrame
输入
- oddataDataFrame
OD数据
- shapeGeoDataFrame
集计小区的GeoDataFrame
- colList
起终点列名,[‘slon’,’slat’,’elon’,’elat’],此时每一列权重为1。 也可以传入权重列,如[‘slon’,’slat’,’elon’,’elat’,’count’]
- paramsList
栅格化参数,如果传入,则先栅格化后以栅格中心点匹配小区,如果不传入,则直接以经纬度匹配。在数据量大时,用栅格化进行匹配速度会极大提升
- round_accuracynumber
集计时经纬度取小数位数
- arrowbool
生成的OD地理线型是否包含箭头
输出
- oddata1GeoDataFrame
集计后生成OD的GeoDataFrame