温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于纽约的共享单车使用数据的可视化和建模
工商管理专业
基于
纽约
共享
单车
使用
数据
可视化
建模
工商管理
专业
摘 要中间空两格,四号,黑体,居中
随私家车数量的快速发展,交通资源日益紧缺,一线城市已因为交通堵塞大大的增加了出行的时间成本。大力发展公共交通是缓解交通压力的有效手段。以东京为例,所有的住宅中距离最近的车站不足500米的占比达到61.9%,超过一千米的只有0.53%[1]。而很多中国民众因为家与车站的距离稍远而放弃选择公共交通。共享单车的出现改善了这一问题,鼓励了更多的人选择公共交通。本文将基于纽约的城市自行车数据对其进行数据可视化,并爬取相关的天气信息,建立线性模型预测每日公共自行车的的使用量,从而利于公共自行车管理者优车站设置以及车辆调配。
关键字小四,黑体,顶格写
: 公共交通;共享单车;小四,宋体,分号隔开
数据可视化;线性回归
Abstract四号,Times New Roman,加粗,居中
With the rapid development of the number of private cars, the transportation resources are becoming increasingly scarce. The first-tier cities have greatly increased travel time costs due to traffic congestion. Vigorously developing public transport is an effective means to ease traffic pressure. Take Tokyo as an example. The percentage of all homes that are less than 500 meters from the nearest station is 61.9%, and only 0.53% is over one kilometer. Many Chinese people have given up on public transportation because of the distance between their home and the station. The emergence of shared bicycles has improved this problem and encouraged more people to choose public transport. This article will be based on New York City’s urban bicycle data to visualize the data, and crawl related weather information, establish a linear model to forecast the daily use of public bikes, which will benefit the public bicycle operators to set the optimal station and vehicle deployment.
Key 小四,Times New Roman,加粗,顶格写
Word: transportation resources; shared bike; data visualization; linear regression
目 录中间空两格,三号字,黑体,居中
1. 背景介绍
“最后一公里”是阻碍公共交通普及与发展的痛点,人们在“最后一公里”中出行成本较高同时也存在一定的社会不安全因素,例如刺激了不安全的摩的或者三轮车等非正规运营手段的发展,并且这部分运营车辆时长出现闯红灯、乱停放等妨害交通秩序的行为,大大影响了交通管理和乘客的人生安全。另外,部分市民因为车站与家的距离稍远,也在一定程度上打击了这部分市民选择乘坐公共交通的积极性,共享单车的出现以及市场化,为解决“最后一公里”难题提供了全新的解决方案,降低了市民在最后一公里的出行成本,打击了黑车市场,填补了住宅到车站的公共交通空隙,有利于推行绿色环保的出行理念[2]。2014年起,共享单车逐步投放到中国的各个大学,由于共享单车十分适合大学生以及部分高校教职工的需要,共享单车在高校市场慢慢站稳脚跟,并在这次成功的尝试后把市场拓展到城市中,逐渐成为具有竞争优势的新兴出行交通工具。
新事物的诞生必然伴随着许多问题,第一是没车,在很多人流量特别少的并且地理位置相对比较偏僻的地方,车辆流动速度比较缓慢,当一辆车被骑走时,很难预测下一辆车什么时候会骑回来,这个问题到最后会演变为无车可骑的窘境;第二对于人流量大的地方,无论共享单车的数量多么充足,这批共享单车只能满足第一批“抢到”共享单车的用户,后来者也很有可能面临无车可骑的问题,在上下班高峰期,类似情况并不少见[3]。
总结以上提出的问题,是共享单车管理效率的问题,如何提高共享单车的利用率,在什么地方投放共享单车,如何设置投放的频率,是提升共享单车服务水平的一大关键。本文将围绕纽约城市共享单车的使用数据进行数据可视化,体现每个位置共享单车的使用情况,并根据天气、工作日与非工作日、假期等建立适当的模型来预测共享单车的使用量。
2.数据获取、处理与可视化
2.1获取城市自行车使用数据
Citi Bike是一家位于纽约的私有盈利的公共自行车公司,自2013年5月开始运营,目前也是美国最大的公共自行车,因此我们选用该公司的数据进行研究。
从纽约Citi Bike官方网站( bike官网记录数据自2013年6月至今,选用其中一年,即从2017年4月1日至2018年3月31日的数据作为研究对象。数据总量约为1200万骑行数据。
Table 1 使用数据样例
名词
注释
单位
TRIP DURATION
骑行时长
秒
START TIME
开始时间
日期,时间
STOP TIME
停止时间
日期,时间
START STATION ID
起始站
标记数字
START STATION NAME
起始站点名字
START STATION LATITUDE
起始站点纬度
START STATION LONGITUDE
起始站点经度
END STATION ID
终点站
标记数字
END STATION NAME
终点站名字
END STATION LATITUDE
终点纬度
END STATION LONGITUDE
终点站点经度
BIKEID
自行车唯一识别码
USERTYPE
用户类型
BIRTHYEAR
出生年份
GENDER
性别
0=未知;1=男性; 2=女性
Table 2 相关变量注释
为了更好的分析citi bike的使用情况,我们还需考虑天气因素。利用R里的Rcurl包对专业天气网站()爬取天气数据。其中对两种不同类型的天气数据进行读取,第一种是读取2017年4月1日至2018年3月31日每日的天气数据,总共365个观测值,包含当日的降雨量,最高气温,最低气温,平均气温,最大能见度,最小能见度,平均能见度以及风力等天气变量;其二是读取每日每小时的天气数据,数据量总共是365×24,观测变量与前者类似。
DATE
TEMP_H
TEMP_A
TEMP_L
HUMID_H
HUMID_A
HUMID_L
VISI_H
VISI_A
VISI_L
WIND_H
WIND_A
WIND_L
4/1/2017
50
42
37
93
77
59
10
9
4
28
13
38
4/2/2017
64
52
41
71
47
24
10
10
10
9
3
-
4/3/2017
61
53
46
71
51
31
10
10
8
15
4
51
4/4/2017
48
48
46
100
91
71
10
7
1
21
11
29
4/5/2017
62
53
44
100
85
52
10
5
0
15
4
48
4/6/2017
52
47
42
100
90
80
10
7
1
29
14
36
4/7/2017
50
46
42
87
65
50
10
10
9
21
13
43
4/8/2017
60
50
39
62
40
23
10
10
7
10
5
43
4/9/2017
66
53
42
57
40
23
10
10
9
10
4
-
4/10/2017
75
63
51
59
44
33
10
10
8
12
6
18
4/11/2017
78
67
57
68
54
36
10
10
8
8
5
-
4/12/2017
75
65
55
82
62
24
10
9
5
14
4
17
4/13/2017
66
57
48
63
41
26
10
10
9
12
4
17
4/14/2017
64
57
50
54
41
28
10
10
9
12
5
17
4/15/2017
63
55
48
88
63
47
10
10
7
10
4
17
Table 3 每日天气
DATE
TIME
TEMP.
HUMIDITY
PRESSURE
VISIBILITY
WIND.SPEED
PRECIP
EVENTS
CONDITIONS
4/1/2017
12:15 AM
39.2 °F
93%
30.41 in
5.0 mi
20.7 mph
9.99 in
Overcast
4/1/2017
1:15 AM
39.2 °F
93%
30.41 in
6.0 mi
21.9 mph
N/A
Overcast
4/1/2017
2:15 AM
39.2 °F
93%
30.41 in
6.0 mi
21.9 mph
N/A
Overcast
4/1/2017
3:15 AM
39.2 °F
93%
30.41 in
4.0 mi
25.3 mph
N/A
Overcast
4/1/2017
4:15 AM
39.2 °F
93%
30.41 in
4.0 mi
11.5 mph
N/A
Overcast
4/1/2017
5:15 AM
39.2 °F
93%
30.41 in
5.0 mi
9.2 mph
N/A
Overcast
4/1/2017
6:15 AM
37.4 °F
93%
30.41 in
6.0 mi
3.5 mph
N/A
Overcast
4/1/2017
7:15 AM
37.4 °F
93%
30.41 in
10.0 mi
5.8 mph
N/A
Overcas