基于大数据的智能交通体系架构

第41卷第2期2015年4月

兰州理工大学学报

Joumal0fIanzhouIhiverSityofTechnology

VDL41N0.2

Apr.2015

文章编号:1673—5196(2015)02_0112-04

基于大数据的智能交通体系架构

红1’2,王晓明1,曹洁2,朱昶胜2

(1.兰州理工大学电气工程与信息工程学院,甘肃兰州730050;2.兰州理工大学计算机与通信学院,甘肃兰州730050)

摘要:根据智能交通大数据处理的强实时性和高效性特点,构建基于大数据技术的智能交通数据处理平台,对其关

键技术和处理流程深入分析,并从方法论角度提出针对该平台的交通大数据处理体系架构,系统地从数据源、数据

处理、知识库和应用四个方面论述该架构的主要研究内容和架构所涉及的理论、方法与技术,为交通大数据的深入分析与处理奠定基础.

关键词:大数据;智能交通;Hadoop;体系架构;分布式计算中图分类号:TP393

文献标识码:A

Architectulleof

ZHANG

(1.C0llege

intellig锄ttramcsystemsb嬲ed蚰big

data

Hon91”,WANGXiao-min91,CA0Jie2,ZHUChang-shen92

730050,China;2.College

ofElectri∞l&Info册ationEllgin神^Tlg,LanzhouUIliv.ofTec}L,Ianzhou

rIi∞tion,La北houUTliv.ofTe出,Lar屹hou730050,Chi眦)

ofComputer&伤mmu—

Abst髓ct:fhsed

ingflow

on

strong

real_timecharacteristicsandhighefficiencyoftrafficbigdataprocessing,a

on

trafficdataprocessingplatformbased

are

bigdatatechniqueisbu订tup,anditskeytechniqueand

process—

analyzedindetail.Andthearchitectureoftrafficbigdataprocessingsystemisproposedfor

Themaininvestigationtopicsofthisarchitectureandits

con—

thisplatformfrommethodologicalview.

cemed

theory,

methodandtechnique

are

discussedinconnectionwithdata

source,

dataprocessing,

knowledgedatabase,andapplicationofthesystem,layingoftrafficdat色

foundationfordetailedanalysisandprocessing

l‘碡yV川)rds:bigdata;intelligenttraffic;Hadoop;systemarchitecture;distributedcomputation

信息通讯技术的发展,使交通运输从数据贫乏转向数据丰富的大数据时代,北京市6万余辆出租车一天就会产生数亿条GPS数据,车牌识别、交通监控视频等数据量更大,交通相关的数据量级已从TB级别跃升到PB级别,对智能交通系统的运营和管理产生了巨大影响[1].面对众多的交通大数据,如何对其进行准确、高效的处理和分析及预测,挖掘其中蕴含的深层应用,做出即时和正确的交通诱导和疏通以有效改善实际交通拥堵状况成为智能化交通信息处理分析的核心内容[2].

目前,国际智能交通领域的车路协同系统、公众出行便捷服务、车联网等热点技术领域都在广泛研究和应用大数据技术[31;2013年10月在日本举办

收稿日期:2014一09一16

的第20届世界智能交通大会上,交通大数据的研究非常活跃.姜锋通过搭建4个节点的Hadoop集群,对Web日志文件进行处理,论证了Hadoop系统在处理日志时的高效性[4].北京交通大学岳建明从交通运行效率、交通安全水平、环境监测几个方面研究了大数据对智能交通的作用[51;周为钢等提出了构建交通大数据处理平台的方案,并讲述了涉及到的核心技术[6].宫夏屹综述了大数据平台技术,认为目前对大数据平台的研究主要基于Hadoop平台且比较零散,还没有形成支撑大数据平台开发的相关技术体系[7].可见,对交通大数据平台架构的研究比较少,所构建的平台也只是原型系统,缺乏系统的方法体系与应用.因此,对交通大数据平台架构的研究势在必行,急需一个新的大数据处理平台架构来支撑跨领域、异构交通大数据的管理、分析和处理.

本文系统地论述了构建基于大数据的智能交通体系平台和框架所涉及的理论、方法与技术.

基金项目:甘肃省自然科学基金(1010尉ZA046),高校基本科

研项目(1203ZTCl79)

作者简介:张红(1977一),女,甘肃天水人,博士生,讲师.

万方数据

第2期张红等:基于大数据的智能交通体系架构

1大数据在智能交通领域的应用

交通大数据的活化应用对交通的发展将带来巨大的变化,这主要体现在大数据技术的实时性、分布性、高效性及预测性方面[8].

1)实时性.传统的海量数据模糊查询和统计分析无法达到交通实时性的需求,大数据能够实时地对交通大数据分析、处理,提供秒级响应,帮助人们在海量的交通数据中快速发现交通异常,并定位症结,方便交通管理,使交通运行得更加合理.

2)分布性.传统的数据应用多为单表挖掘分析,一旦涉及到跨表关联就会因效率问题而无能为力,大数据的分布式并行处理擅长复杂的块表关联分析,推动数据串并关联,提高数据处理能力,支撑高并发多用户访问,协同人们在交通紧急事件中多方协作、快速处置.

3)高效性.高效的交通大数据挖掘能力,能够快速发现海量交通数据中的内在关联规律,进而提高交通运营效率以及路网的通行能力.伦敦市利用大数据减少了交通拥堵时间,提高了交通运转效

率[6|.

4)预测性.大数据技术较高的预测能力可降低交通状态误报和漏报的概率,通过建立区域交通状态的监测及预测模型,共享交通运行与路况环境数据,随时对交通的动态性进行实时监控,帮助驾驶者及用户预先了解交通拥堵状况,避开拥堵路段.

大数据对交通的巨大影响除了以上几个方面外,对交通环境的安全性也有巨大影响.大数据的实时性和可预测性以及综合的决策模型有助于提高交通安全系统的数据处理能力.大数据快速整合各个传感器数据,结合车辆运行轨迹数据,综合分析车辆行驶安全性,为应急决策提供辅助,提高应急救援能力,有效降低交通事故的发生[9].由此可见,大数据技术的出现及应用能够有效地解决智能交通面临的好多难题,为了利用大数据技术,深人挖掘交通数据的潜在价值,需要一个数据管理平台来处理各种类型和规模的数据.

2交通大数据处理平台

交通大数据处理基本流程与传统数据处理流程基本相似,整个处理流程可以概括为数据采集、数据导人和预处理、数据存储、数据处理和结果展现[101.由于交通大数据要处理大量的、非结构化的数据,如视频数据及监控数据,而且要求处理的强实时性,所以在各个处理环节中采用MapReduce分布式计算

万方数据

框架以及实时流数据处理计算框架,数据存储用支持文本和图像存储,面向列、可伸缩,支持事务以及B树范围查询和排序的分布式数据库HBase和分布式文件存储系统HDFS(Hadoop

DistributedFile

System)[11-12].依据大数据处理流程及交通数据处理的特性,整个平台的构建分两部分,依次为对交通大数据离线批处理、深度挖掘的Hadoop生态系统和对交通大数据进行强实时流式计算的storm处理系统,平台搭建如图1所示.

唾一陵昌曩

.・一……………………………………’,.一………………‘・~1

iHadoop分布式离线批处理{isto肌实时流计算j

i\竺竺兰/j

使用构建在Hadoop生态系统上的分布式日志处理系统Chukwa收集交通数据源,用数据同步工具Sq∞p实现各种交通数据源和Hadoop分布式文件系统HDFS间的数据转移和传输[131.鉴于交通流数据处理的强实时性,系统构建对Hadoop平台进行了扩展,引入实时犬数据流处理系统Storm.因此在交通大数据处理层包含基于Hadoop的分布式离线处理计算框架和基于Storm的实时流数据处理计算框架.其中,MapReduce通过map和reduce两个步骤实现交通数据的并行处理[141;Impala提供SQL语义,对存储在Hadoop的HDFS和HBase中

兰州理工大学学报

第41卷

的PB级交通大数据实现交互式的快速查询;利用Mahout提供的可扩展的机器学习和数据挖掘的分布式框架,实现交通大数据的并行分析与挖掘.Storm平台克服了Hadoop平台不能有效适应实时数据处理的缺陷,提供全内存计算,实现对流式交通数据的实时处理,它提供的输人流组件Spout负责将数据传递给另一个组件Bolt,Bolt执行任务,如交通流数据的过滤、计算、访问文件/数据库等,并创建新的流作为下一个Bolt的输人流.数据展现层利用大数据分析工具Karmasphere实现结果数据的可视化,迅速有效地简化提炼数据流,提供具有交互功能的动态图表,帮助人们探索和解释复杂的数据,理解和分析数据的内涵与特征,更好地从复杂数据中得到新的发现.

强,处理速度快,是典型的大数据,如何利用好这些多源的大量数据为交通决策与诱导提供便利,有效缓解交通拥堵是交通领域的难题,也是智能交通首要解决的问题.在综合考虑了交通数据的特性以及应用需求的基础上,本文设计了如图2所示的交通大数据处理体系框架.该框架基于图1所示的交通大数据处理平台设计,包含四层结构,分别为数据源层、数据处理层、知识层以及应用层[15].

1)数据源层.交通异构数据源有结构化的数据,大部分都是非结构化的数据,这些数据源主要包括无线射频识别数据(radio口信号灯等)、GPS(global

frequencyidentifica—

tion,RFID)、视频监控、卡扣数据(包括肼C、交叉

positioning

system)轨迹

数据、IC卡刷卡数据、交通应用服务数据等.

2)数据处理层.数据处理层是大数据处理体系框架的核心层,Sqoop整合数据源数据,存储于分布式数据库HBase中.这里采用基于HDFS的HBase

3交通大数据处理体系框架

交通数据不仅量大而且异构源多,实时性要求

数据源层

数据处理层

--●

知识层

一●

应用层

图2交通大数据处理体系架构

n辱2

Ardhitelc臼n℃oftrafnc

big幽ta

pr∞e鲻i呜syst锄

万方数据

第2期

张红等:基于大数据的智能交通体系架构

和Impala的存储系统,Impala提供实时的交互式SQI.大数据查询功能,直接从HBase中用SE—I。ECT、JOIN和统计函数查询数据,实现快速的大数据存储和分析.根据不同的交通需求,系统设计了两套计算框架,MapReduce离线计算框架用作交通模型的预测和交通运行规律的挖掘,Storm实时交通流计算框架用于处理实时交通流数据,并对交通流进行短期的预测[161.数据处理结果进行可视化分析,以动态图表的形式展现给用户.

3)知识层.交通大数据的处理就是要对数据进行深层分析、挖掘数据所蕴含的深层知识,寻找数据内部隐藏的规律[17f,这里主要包含居民日常出行行为、居民的出行模式、依据城市特点的交通运营决策及规划、居民个体活动知识、城市的动态性特征、城市的空间分布规律等.对交通视频及图像采用CU—DA架构,快速提取其特征和摘要以备挖掘分析,对卡扣和应用服务数据及GPS等数据基于MapRe—duce计算模型用Mahout进行并行分析与挖掘,形成知识,为智能交通系统提供更高层的应用与管理.

4)应用层.所有的研究都将归结于应用,大数据为智能交通的进一步发展起到了极大的促进作用,主要产生了以下几个方面的应用:交通拥堵自动检测,路网地图更新,交通供求分析,道路规划,交通费用预测,实时路况展现,交通异常检测,智能电子停车,出行信息服务,交通诱导等[1

8|.

4结论

数据是驱动智能交通发展的基础,大数据技术的开发利用将为智能交通的进一步发展带来质的飞跃[19|.在广泛阅读交通大数据相关文献资料的基础上,本文建立了基于大数据的智能交通体系框架,该架构能够兼顾交通数据处理的强实时性和高效性,也兼顾了交通数据量大、异构且分散的特点,文中对智能交通目前所面临的热点问题如交通流短时预测、交通诱导、居民出行模式等运用大数据技术进行了简单的剖析,有望通过大数据技术解决这些关键问题,这也是各个大城市正在建设规划的智慧城市研究的重要内容.

接下来要做的工作是基于本文所述的交通大数据处理体系架构和交通大数据处理平台,结合兰州“智慧城市”建设,搭建软硬件平台,对兰州公交公司提供的出租车及公交车GPS大数据进行实地挖掘分析,提炼出高价值的信息,推动兰州智慧交通与低碳城市建设,缓解日益严重的交通拥堵问题.加强大数据异构信息融合技术的研究,通过对平台管理的

万方数据

大数据信息资源进行补充、完善与整合,为领域业务应用提供更为全面的信息支撑.

参考文献:

[1]杨万三。智能交通管理一次颠覆传统的技术变革[EB/oI。].

2013_04一08[2013∞4一19].http://w、)lrw.21Its.com/common/

NewsDetail。aspx?ID一2013040811375806088.

[2]韩耀强.大数据:智慧城市的发展引擎[EB/0L].2013_04.08

[2013一04一19].http://、^帆mis6.conl/news/detail/105004003/

1574183268.htnlL

[3]MuKHE刚EERTraveland

transponationintheageofbig

data[EB/0L].2012-08—28[2013-04—20].http://www.ibm—

bigdatahub.com/blog/travel一and—transportatiomage-big—ata.[4]姜锋.基于Had00p平台的海晕数据处理研究及应用[D].

北京:北京邮电大学,2012.

[5]岳建明,袁伦渠.智能交通发展中的大数据分析[J].生产力研

究,2013(6):137一138,165.

[6]周为钢,杨良怀,潘建,等.论智能交通大数据处理平台之构

建[c]//第八届中国智能交通年会优秀论文集.北京:电子工

业出版社,2013:158—167.

[7]官夏屹,李伯虎,柴旭东,等.大数据平台技术综述[J].系统仿

真学报,2014,26(3):489—496.[8]

RucKsG.How

big

data

d^ves

intelligent

transponation

[EB/OL].2012-08—15[2013-04—20].http://www.greenbiz.

com/b1Qg/2012/08/15/how山ig-data-drives_intelligent—trans—

portation?page—O%2C1.

[9]李国杰.大数据研究的科学价值[J].中国计算机学会通讯,

2012,8(9):8—15.

[10]陆化普,李瑞敏,朱茵.智能交通系统概论[M].北京;中国

铁道出版社,2008.

[11]cHEN

c,LIUz,LIN

wH,甜口z.Dist舶utedmodeliflg

in

mapreduce

frameworkfordata’driventraffIcnowforecastillg

[J].IEEETran髓ctions

0n

IntelligentTTansponationSys—

tems,2013,14(1):22—33.

[12]覃雄派,王会举,杜小勇,等.大数据分析一RDBMs与MapRe—

duce的竞争与共生[J].软件学报,2012,23(1):32—45.

[13]wHITET.Hadoop权威指南[M].2版.周敏奇,王晓玲等

译.北京;清华大学出版社,2011.

[14]

sHIMK.Mapreduce

algo—tms

forbigdataa11alysis[c]//

Proce商ngsoftheⅥJ]B

Er】dawment

Istallbul:[sn],2012:

2016—2017.

[15]王静远,李超,熊璋,等.以数据为中心的智慧城市研究综

述[J].计算机研究与发展,2014,51(2);239-259.

[16]张秋余,朱学明.基于G昏ElmaIl神经网络的交通流短时预测

方法口].兰州理工大学学报,2013,39(3):94—98.

[17]程学旗,王元卓.大数据计算的技术体系与引擎系统[J].高

科技与产业化,2013,9(5):62—65.

[18]郑字.城市计算与大数据[J].中国计算机学会通讯,2013,

9(8):8一18.

[19]李国杰,程学期.大数据研究:未来科技及经济社会发展的重

大战略领域一大数据的研究现状与科学思考[J].中国科学院院刊,2012,27(6):647.657.

第41卷第2期2015年4月

兰州理工大学学报

Joumal0fIanzhouIhiverSityofTechnology

VDL41N0.2

Apr.2015

文章编号:1673—5196(2015)02_0112-04

基于大数据的智能交通体系架构

红1’2,王晓明1,曹洁2,朱昶胜2

(1.兰州理工大学电气工程与信息工程学院,甘肃兰州730050;2.兰州理工大学计算机与通信学院,甘肃兰州730050)

摘要:根据智能交通大数据处理的强实时性和高效性特点,构建基于大数据技术的智能交通数据处理平台,对其关

键技术和处理流程深入分析,并从方法论角度提出针对该平台的交通大数据处理体系架构,系统地从数据源、数据

处理、知识库和应用四个方面论述该架构的主要研究内容和架构所涉及的理论、方法与技术,为交通大数据的深入分析与处理奠定基础.

关键词:大数据;智能交通;Hadoop;体系架构;分布式计算中图分类号:TP393

文献标识码:A

Architectulleof

ZHANG

(1.C0llege

intellig锄ttramcsystemsb嬲ed蚰big

data

Hon91”,WANGXiao-min91,CA0Jie2,ZHUChang-shen92

730050,China;2.College

ofElectri∞l&Info册ationEllgin神^Tlg,LanzhouUIliv.ofTec}L,Ianzhou

rIi∞tion,La北houUTliv.ofTe出,Lar屹hou730050,Chi眦)

ofComputer&伤mmu—

Abst髓ct:fhsed

ingflow

on

strong

real_timecharacteristicsandhighefficiencyoftrafficbigdataprocessing,a

on

trafficdataprocessingplatformbased

are

bigdatatechniqueisbu订tup,anditskeytechniqueand

process—

analyzedindetail.Andthearchitectureoftrafficbigdataprocessingsystemisproposedfor

Themaininvestigationtopicsofthisarchitectureandits

con—

thisplatformfrommethodologicalview.

cemed

theory,

methodandtechnique

are

discussedinconnectionwithdata

source,

dataprocessing,

knowledgedatabase,andapplicationofthesystem,layingoftrafficdat色

foundationfordetailedanalysisandprocessing

l‘碡yV川)rds:bigdata;intelligenttraffic;Hadoop;systemarchitecture;distributedcomputation

信息通讯技术的发展,使交通运输从数据贫乏转向数据丰富的大数据时代,北京市6万余辆出租车一天就会产生数亿条GPS数据,车牌识别、交通监控视频等数据量更大,交通相关的数据量级已从TB级别跃升到PB级别,对智能交通系统的运营和管理产生了巨大影响[1].面对众多的交通大数据,如何对其进行准确、高效的处理和分析及预测,挖掘其中蕴含的深层应用,做出即时和正确的交通诱导和疏通以有效改善实际交通拥堵状况成为智能化交通信息处理分析的核心内容[2].

目前,国际智能交通领域的车路协同系统、公众出行便捷服务、车联网等热点技术领域都在广泛研究和应用大数据技术[31;2013年10月在日本举办

收稿日期:2014一09一16

的第20届世界智能交通大会上,交通大数据的研究非常活跃.姜锋通过搭建4个节点的Hadoop集群,对Web日志文件进行处理,论证了Hadoop系统在处理日志时的高效性[4].北京交通大学岳建明从交通运行效率、交通安全水平、环境监测几个方面研究了大数据对智能交通的作用[51;周为钢等提出了构建交通大数据处理平台的方案,并讲述了涉及到的核心技术[6].宫夏屹综述了大数据平台技术,认为目前对大数据平台的研究主要基于Hadoop平台且比较零散,还没有形成支撑大数据平台开发的相关技术体系[7].可见,对交通大数据平台架构的研究比较少,所构建的平台也只是原型系统,缺乏系统的方法体系与应用.因此,对交通大数据平台架构的研究势在必行,急需一个新的大数据处理平台架构来支撑跨领域、异构交通大数据的管理、分析和处理.

本文系统地论述了构建基于大数据的智能交通体系平台和框架所涉及的理论、方法与技术.

基金项目:甘肃省自然科学基金(1010尉ZA046),高校基本科

研项目(1203ZTCl79)

作者简介:张红(1977一),女,甘肃天水人,博士生,讲师.

万方数据

第2期张红等:基于大数据的智能交通体系架构

1大数据在智能交通领域的应用

交通大数据的活化应用对交通的发展将带来巨大的变化,这主要体现在大数据技术的实时性、分布性、高效性及预测性方面[8].

1)实时性.传统的海量数据模糊查询和统计分析无法达到交通实时性的需求,大数据能够实时地对交通大数据分析、处理,提供秒级响应,帮助人们在海量的交通数据中快速发现交通异常,并定位症结,方便交通管理,使交通运行得更加合理.

2)分布性.传统的数据应用多为单表挖掘分析,一旦涉及到跨表关联就会因效率问题而无能为力,大数据的分布式并行处理擅长复杂的块表关联分析,推动数据串并关联,提高数据处理能力,支撑高并发多用户访问,协同人们在交通紧急事件中多方协作、快速处置.

3)高效性.高效的交通大数据挖掘能力,能够快速发现海量交通数据中的内在关联规律,进而提高交通运营效率以及路网的通行能力.伦敦市利用大数据减少了交通拥堵时间,提高了交通运转效

率[6|.

4)预测性.大数据技术较高的预测能力可降低交通状态误报和漏报的概率,通过建立区域交通状态的监测及预测模型,共享交通运行与路况环境数据,随时对交通的动态性进行实时监控,帮助驾驶者及用户预先了解交通拥堵状况,避开拥堵路段.

大数据对交通的巨大影响除了以上几个方面外,对交通环境的安全性也有巨大影响.大数据的实时性和可预测性以及综合的决策模型有助于提高交通安全系统的数据处理能力.大数据快速整合各个传感器数据,结合车辆运行轨迹数据,综合分析车辆行驶安全性,为应急决策提供辅助,提高应急救援能力,有效降低交通事故的发生[9].由此可见,大数据技术的出现及应用能够有效地解决智能交通面临的好多难题,为了利用大数据技术,深人挖掘交通数据的潜在价值,需要一个数据管理平台来处理各种类型和规模的数据.

2交通大数据处理平台

交通大数据处理基本流程与传统数据处理流程基本相似,整个处理流程可以概括为数据采集、数据导人和预处理、数据存储、数据处理和结果展现[101.由于交通大数据要处理大量的、非结构化的数据,如视频数据及监控数据,而且要求处理的强实时性,所以在各个处理环节中采用MapReduce分布式计算

万方数据

框架以及实时流数据处理计算框架,数据存储用支持文本和图像存储,面向列、可伸缩,支持事务以及B树范围查询和排序的分布式数据库HBase和分布式文件存储系统HDFS(Hadoop

DistributedFile

System)[11-12].依据大数据处理流程及交通数据处理的特性,整个平台的构建分两部分,依次为对交通大数据离线批处理、深度挖掘的Hadoop生态系统和对交通大数据进行强实时流式计算的storm处理系统,平台搭建如图1所示.

唾一陵昌曩

.・一……………………………………’,.一………………‘・~1

iHadoop分布式离线批处理{isto肌实时流计算j

i\竺竺兰/j

使用构建在Hadoop生态系统上的分布式日志处理系统Chukwa收集交通数据源,用数据同步工具Sq∞p实现各种交通数据源和Hadoop分布式文件系统HDFS间的数据转移和传输[131.鉴于交通流数据处理的强实时性,系统构建对Hadoop平台进行了扩展,引入实时犬数据流处理系统Storm.因此在交通大数据处理层包含基于Hadoop的分布式离线处理计算框架和基于Storm的实时流数据处理计算框架.其中,MapReduce通过map和reduce两个步骤实现交通数据的并行处理[141;Impala提供SQL语义,对存储在Hadoop的HDFS和HBase中

兰州理工大学学报

第41卷

的PB级交通大数据实现交互式的快速查询;利用Mahout提供的可扩展的机器学习和数据挖掘的分布式框架,实现交通大数据的并行分析与挖掘.Storm平台克服了Hadoop平台不能有效适应实时数据处理的缺陷,提供全内存计算,实现对流式交通数据的实时处理,它提供的输人流组件Spout负责将数据传递给另一个组件Bolt,Bolt执行任务,如交通流数据的过滤、计算、访问文件/数据库等,并创建新的流作为下一个Bolt的输人流.数据展现层利用大数据分析工具Karmasphere实现结果数据的可视化,迅速有效地简化提炼数据流,提供具有交互功能的动态图表,帮助人们探索和解释复杂的数据,理解和分析数据的内涵与特征,更好地从复杂数据中得到新的发现.

强,处理速度快,是典型的大数据,如何利用好这些多源的大量数据为交通决策与诱导提供便利,有效缓解交通拥堵是交通领域的难题,也是智能交通首要解决的问题.在综合考虑了交通数据的特性以及应用需求的基础上,本文设计了如图2所示的交通大数据处理体系框架.该框架基于图1所示的交通大数据处理平台设计,包含四层结构,分别为数据源层、数据处理层、知识层以及应用层[15].

1)数据源层.交通异构数据源有结构化的数据,大部分都是非结构化的数据,这些数据源主要包括无线射频识别数据(radio口信号灯等)、GPS(global

frequencyidentifica—

tion,RFID)、视频监控、卡扣数据(包括肼C、交叉

positioning

system)轨迹

数据、IC卡刷卡数据、交通应用服务数据等.

2)数据处理层.数据处理层是大数据处理体系框架的核心层,Sqoop整合数据源数据,存储于分布式数据库HBase中.这里采用基于HDFS的HBase

3交通大数据处理体系框架

交通数据不仅量大而且异构源多,实时性要求

数据源层

数据处理层

--●

知识层

一●

应用层

图2交通大数据处理体系架构

n辱2

Ardhitelc臼n℃oftrafnc

big幽ta

pr∞e鲻i呜syst锄

万方数据

第2期

张红等:基于大数据的智能交通体系架构

和Impala的存储系统,Impala提供实时的交互式SQI.大数据查询功能,直接从HBase中用SE—I。ECT、JOIN和统计函数查询数据,实现快速的大数据存储和分析.根据不同的交通需求,系统设计了两套计算框架,MapReduce离线计算框架用作交通模型的预测和交通运行规律的挖掘,Storm实时交通流计算框架用于处理实时交通流数据,并对交通流进行短期的预测[161.数据处理结果进行可视化分析,以动态图表的形式展现给用户.

3)知识层.交通大数据的处理就是要对数据进行深层分析、挖掘数据所蕴含的深层知识,寻找数据内部隐藏的规律[17f,这里主要包含居民日常出行行为、居民的出行模式、依据城市特点的交通运营决策及规划、居民个体活动知识、城市的动态性特征、城市的空间分布规律等.对交通视频及图像采用CU—DA架构,快速提取其特征和摘要以备挖掘分析,对卡扣和应用服务数据及GPS等数据基于MapRe—duce计算模型用Mahout进行并行分析与挖掘,形成知识,为智能交通系统提供更高层的应用与管理.

4)应用层.所有的研究都将归结于应用,大数据为智能交通的进一步发展起到了极大的促进作用,主要产生了以下几个方面的应用:交通拥堵自动检测,路网地图更新,交通供求分析,道路规划,交通费用预测,实时路况展现,交通异常检测,智能电子停车,出行信息服务,交通诱导等[1

8|.

4结论

数据是驱动智能交通发展的基础,大数据技术的开发利用将为智能交通的进一步发展带来质的飞跃[19|.在广泛阅读交通大数据相关文献资料的基础上,本文建立了基于大数据的智能交通体系框架,该架构能够兼顾交通数据处理的强实时性和高效性,也兼顾了交通数据量大、异构且分散的特点,文中对智能交通目前所面临的热点问题如交通流短时预测、交通诱导、居民出行模式等运用大数据技术进行了简单的剖析,有望通过大数据技术解决这些关键问题,这也是各个大城市正在建设规划的智慧城市研究的重要内容.

接下来要做的工作是基于本文所述的交通大数据处理体系架构和交通大数据处理平台,结合兰州“智慧城市”建设,搭建软硬件平台,对兰州公交公司提供的出租车及公交车GPS大数据进行实地挖掘分析,提炼出高价值的信息,推动兰州智慧交通与低碳城市建设,缓解日益严重的交通拥堵问题.加强大数据异构信息融合技术的研究,通过对平台管理的

万方数据

大数据信息资源进行补充、完善与整合,为领域业务应用提供更为全面的信息支撑.

参考文献:

[1]杨万三。智能交通管理一次颠覆传统的技术变革[EB/oI。].

2013_04一08[2013∞4一19].http://w、)lrw.21Its.com/common/

NewsDetail。aspx?ID一2013040811375806088.

[2]韩耀强.大数据:智慧城市的发展引擎[EB/0L].2013_04.08

[2013一04一19].http://、^帆mis6.conl/news/detail/105004003/

1574183268.htnlL

[3]MuKHE刚EERTraveland

transponationintheageofbig

data[EB/0L].2012-08—28[2013-04—20].http://www.ibm—

bigdatahub.com/blog/travel一and—transportatiomage-big—ata.[4]姜锋.基于Had00p平台的海晕数据处理研究及应用[D].

北京:北京邮电大学,2012.

[5]岳建明,袁伦渠.智能交通发展中的大数据分析[J].生产力研

究,2013(6):137一138,165.

[6]周为钢,杨良怀,潘建,等.论智能交通大数据处理平台之构

建[c]//第八届中国智能交通年会优秀论文集.北京:电子工

业出版社,2013:158—167.

[7]官夏屹,李伯虎,柴旭东,等.大数据平台技术综述[J].系统仿

真学报,2014,26(3):489—496.[8]

RucKsG.How

big

data

d^ves

intelligent

transponation

[EB/OL].2012-08—15[2013-04—20].http://www.greenbiz.

com/b1Qg/2012/08/15/how山ig-data-drives_intelligent—trans—

portation?page—O%2C1.

[9]李国杰.大数据研究的科学价值[J].中国计算机学会通讯,

2012,8(9):8—15.

[10]陆化普,李瑞敏,朱茵.智能交通系统概论[M].北京;中国

铁道出版社,2008.

[11]cHEN

c,LIUz,LIN

wH,甜口z.Dist舶utedmodeliflg

in

mapreduce

frameworkfordata’driventraffIcnowforecastillg

[J].IEEETran髓ctions

0n

IntelligentTTansponationSys—

tems,2013,14(1):22—33.

[12]覃雄派,王会举,杜小勇,等.大数据分析一RDBMs与MapRe—

duce的竞争与共生[J].软件学报,2012,23(1):32—45.

[13]wHITET.Hadoop权威指南[M].2版.周敏奇,王晓玲等

译.北京;清华大学出版社,2011.

[14]

sHIMK.Mapreduce

algo—tms

forbigdataa11alysis[c]//

Proce商ngsoftheⅥJ]B

Er】dawment

Istallbul:[sn],2012:

2016—2017.

[15]王静远,李超,熊璋,等.以数据为中心的智慧城市研究综

述[J].计算机研究与发展,2014,51(2);239-259.

[16]张秋余,朱学明.基于G昏ElmaIl神经网络的交通流短时预测

方法口].兰州理工大学学报,2013,39(3):94—98.

[17]程学旗,王元卓.大数据计算的技术体系与引擎系统[J].高

科技与产业化,2013,9(5):62—65.

[18]郑字.城市计算与大数据[J].中国计算机学会通讯,2013,

9(8):8一18.

[19]李国杰,程学期.大数据研究:未来科技及经济社会发展的重

大战略领域一大数据的研究现状与科学思考[J].中国科学院院刊,2012,27(6):647.657.


    相关文章

    武汉市智能制造试点示范项目实施方案

    武汉市智能制造试点示范项目实施方案 智能制造已成为当今全球制造业发展趋势,是我国现阶段推进两化深度融合的主攻方向.按照工信部<关于开展2015年智能制造试点示范专项行动的通知>(工信部装[2015]72号)精神,为贯彻落实< ...

    以临床数据仓库为核心的医院大数据平台构建

    专题研究Zhuanti yanjiu <中国医院管理>第35卷第11期(总第412期)2015年11月 以临床数据仓库为核心的医院大数据平台构建* 吴正一① 崔迎慧① 陆 耀①金文忠① 摘要上海某三甲医院基于面向服务的体系架构, ...

    现代通信新技术小论文

    学号 <现代通信新技术>课程论文 题目 作 者 班 级 院 别 业 完成时间 摘 要 随着电信技术的发展,电信管制的开放,IP网络的飞速发展,人们对新业务的需求的增加,都给电信事业的发展提出了新的挑战.本文从下一代网络的基本概念 ...

    城市_规划一张图_总体设计方案研究

    城市"规划一张图"总体设计方案研究 黄萍 孟坚定 [摘要]不断增长和日益丰富的城市规划信息数据应用正向着动态.多目标.智能化的模式发展.使用信息技术对城市规划信息资源进行专题化.网络化和立体化,并使之从辅助审批走向辅助决 ...

    有关云架构建设和选型的思考

    最近在负责公司内部私有云的建设,一直在思考怎么搞云计算,怎么才能够把云架构设计得好一些.本文尽量全面的列出了云架构建设和选型的考量因素. 我们主要从五个层面逐步评估云架构的建设和选型,分别是: 行业生态 企业需求 云计算的能力 潜在的挑战 ...

    国家智能制造标准体系建设指南

    国家智能制造标准体系建设指南 (2015年版) 2015年12月 目录 一. 总体要求............................................................................. ...

    软件工程硕士学位论文题目

    序号 1 2 3 4 5 6 7 8 9 文献标题 来源 年期 来源数据库 2009 基于MPLS VPN技术对电子政务网络改造和优化 合肥工业大学 电子政务信息资源共享的社会运作模式研究 湘潭大学 2009 电子政务信息资源共享的政府主导 ...

    信息组织与管理

    结课大作业 信息组织与管理 学 学 专 生生业姓学班名 号 级 汪厚连 08580101 08信息管理1班 管理工程系 2011年6月7日 目录 1 根据第三章,分别用800字.500字.200字和120字概括第三章内容 ......... ...

    数据交换共享整合系统平台技术方案

    数据交换共享整合协同平台设计 整合协同平台的主要功能是从其它子系统中提取共享数据,并对多来源渠道的.相互不一致的数据进行数据融合处理:基于数据字典对实时数据和历史数据进行组织,以保证数据间关系的正确性.可理解性并避免数据冗余:以各种形式提供 ...