大数据 | 中大学生团队研发地铁出行建议系统获2015 IBM Power大赛全国一等奖

原标题:大数据 | 中大学生团队研发地铁出行建议系统获2015 IBM Power大赛全国一等奖

2015年12月,“IBM Power技术应用2015全国校园大赛总决赛”在北京隆重举行,本次大赛以“开放,让数据大有作为”为主题,聚焦云计算、大数据及移动应用等前沿技术,吸引了来自15个学校的65支代表队参赛。我校“猴赛雷”团队针对大城市交通拥堵、出行成本高的问题,研发的“基于大数据分析的地铁出行建议系统”,凭借其创新的设计和出色的应用前景,得到了评委们的一致青睐,最终斩获大赛一等奖

课题

出行困扰带来设计灵感

“猴赛雷”团队由四名成员组成,分别是资讯管理学院信息管理与信息系统系本科2012级的刘凯琪(队长)、电子与信息技术工程学院智能科学与自动化专业本科2012级的张鑫、数据科学与计算机学院软件工程专业本科2012级的罗双奇和数据科学与计算机学院计算机科学与技术专业本科2014级的杨展富。

他们研发的“基于大数据分析的地铁出行建议系统”,主要致力于解决地铁出行时间预测问题,只要用户在该系统的界面上输入出发时间、出发站点和目的站点,系统就能根据地铁的历史大数据、实时的站内视频人形识别和列车的行驶时间数据,较为准确地算出该次出行所需的时间。

说起这个项目的灵感来源,队员们都笑说要感谢队长刘凯琪的“抱怨”。刘凯琪在去年的暑假实习期间,常常因地铁拥挤、常用地图软件预测时间不准而面临上班迟到的困扰,与其他队员聊起来时,大家都有类似遭遇,他们意识到,几乎每个现代都市人都经常受到出行问题的困扰。

现有的电子地图软件也有交通耗时预测功能,但他们发现,虽然这些软件在公交车的预测上大致准确,可是在地铁的预测上则存在很大问题,因为它们都是单纯基于列车的行驶时间和沿途站点的停靠时间来进行计算,完全没有考虑到高峰时期由于站内拥挤所占用的时间,造成预测结果具有较大的误差,给用户带来了不便。由此,他们确定了课题——研发地铁出行时间预测系统

建模

在困难中不断探索

寻找数据源

然而,正当队员们满怀冲劲想要大展拳脚之时,却发现事情并不如想象的那般简单。由于这个项目是基于大数据分析的结果来对地铁出行时间进行评估和预测,所以数据是项目启动的关键。但是,国内的地铁数据都是保密的,队员们只好另寻数据源,开始在国外的网站上搜索国外地铁的数据。他们很快发现了2014年华盛顿地铁的数据,而且对方公开的数据非常详细,包括某一时刻有多少人进站、他们花了多少时间、从哪里坐到哪里等等,这无疑提供了很好的数据源,整个团队皆为之振奋。

建构系统模型

但接下来,他们又发现了另外一个问题——模型建构,这是整个系统的核心部分。队员们一开始设想的模型,是把地铁线路图等价于公路图,用不同的线段标注不同的拥堵区域,但是他们很快就发现这样是有问题的,因为事实上地铁的拥堵并不出现在行驶的路途中,而是在站点内,这些站点表现在图上,是点状的,和道路交通差异很大,所以他们最初设想的模型完全不可行。

于是他们又开始重新讨论,这时队长刘凯琪想起了自己在运筹学课程中接触到的数学模型,感觉可以运用到项目中,大家也觉得可行,决定一试。最终证明,新的模型是合适的。队员罗双奇表示,这个数学模型正是他们成功的关键所在,“它对后来的软件架构设计有很大帮助,让我们能把整个软件架构模块化,方便开发与调试。”

充分利用SuperVessel超能云

基于大数据分析的应用开发往往需要许多硬件,如多核的处理器、硬件加速器;此外还需要许多软件资源,如专门数据分析的Apache Spark,用于编写GPU加速程序的Cuda等。

团队反映,在硬件资源方面,专业机器昂贵,学生无法购买,这就相当于给相关应用的开发设了一道高门槛;但通过IBM的SuperVessel超能云,他们顺利跨过了这道门槛。“它给高校科研提供免费的云服务,也就是说,我们通过使用网络也能接触到那些强劲的计算机器,如Power PC和FPGA加速器等。”在软件资源方面,他们也通过SuperVessel超能云节省了很多时间。“在Linux系统上安装软件有时候相当麻烦,但只要在SuperVessel超能云的网页端选择好需要的软件,如Spark,Cuda等,然后申请到虚拟机上就会自动安装并配置好相应的软件。”

喜悦

初尝成功

历经两个多月的研发,“猴赛雷”团队研发的地铁出行建议系统终于成型。他们带着这个系统在“IBM Power技术应用2015全国校园大赛”上一路过关斩将,进入了总决赛

决赛的队伍都是来自北京大学、复旦大学、同济大学、重庆大学等国内知名高校,尤其是重庆大学,已经连续两年获得这个赛事的一等奖,并且今年有两个队伍进入了决赛。对手的强大实力本来已经让他们倍感压力,而展示顺序他们还偏偏抽到了第一个,这让队员们更加紧张了。幸好指导老师王变琴有着丰富的大赛指导经验,不断给予队员鼓励和支持,使队员们重拾信心。为求做到更好,队员们熬夜排练到了凌晨四点。

第二天一大早,队员们准备好了,评委老师却来晚了。队员们将这中情景与北京地铁的拥堵巧妙地结合,心里也暗暗感觉“有戏了”,“我们的系统正好解决了地铁出行时间预测的问题,我们的展示说到了评委老师的心里,老师们一直看着我们微笑”。果然,这个“接地气”的系统获得了评委的一致青睐,最终获得了一等奖。队员们事后想来都笑着表示,“这或许就是因祸得福吧,但也说明了,只要作品足够好,展示顺序这些因素其实都不重要。”

展望

项目前景

优胜于同类软件的两层优势

在“猴赛雷”团队看来,他们的系统至少在两个层面上胜于目前同类软件。一方面是预测的准确度,“这个系统通过历史数据的参考和基于实时人形识别的人流计算,把因高峰时段地铁站内拥堵造成的换乘时间增加等问题考虑进出行时间预测之中,大大地提高了预测的准确度。”另一方面是使用模块化设计,“我们把系统像一个机器人那样去构建,由很多不同的零件也就是模块组成,未来如果有更好的数学模型,马上就可以把原有零件拆下来,把更好的组装上去,其它的部分则不需要重新构建,因此我们的系统是可以不断发展的。这次比赛的主题是‘开放让数据大有作为’,我们的设计理念也是这样的。”

广阔的应用前景

这个系统还具有很强的可移植性和可扩展性。它不限于某一时某一地,只要获得某个城市的地铁历史数据,再利用视频人形识别技术,就可以进行计算和预测,“我们可以从广州地铁开始,慢慢应用到其他各大城市”。

除了准确预测地铁出行时间以外,这个系统还可应用到与地铁类似的其它交通工具,比如火车,还能应用于地铁站内治安监控等方面。

目前,“猴赛雷”团队正在申请广东省科技培育专项基金项目,他们希望借助这项基金的支持,把系统运用到广州地铁的真实数据和实际情况中去,用大量的真实数据去进行调试,同时根据实际情况对他们的模型进行修改,以便进一步完善系统。

“过来人”的话

“比赛让我们收获良多”

“猴赛雷”的队员们都表示,这次比赛使他们受益匪浅。在这个过程中,他们不仅做了很多以前没有尝试过的东西,比如写产品说明书、各类文案、比赛展示中的小品剧本,给宣传视频配音、演小品等等,还掌握了许多课外的知识与技能,令他们深感“知识在被需要的时候是学习得最快最好的”。此外,他们还结识了许多该领域的前辈和同行,在交流中学习到不少东西。在他们看来,这是一年一度的高规格高质量的比赛,为高校学子提供了一个很好的展示才华的平台,同时,学校对于学生参与这类比赛也非常支持,作为过来人,他们强烈建议有志于该领域的同学勇敢地尝试和参与

链接

IBM Power技术应用全国校园大赛

IBM Power技术应用全国校园大赛是由国际商业机器(中国)有限公司主办,于每年5月中旬至11月下旬间进行,面向全国高等院校在读本科生、研究生,由高校教师指导学生组队参加,最终由大赛评选委员会评定晋级和奖项,在颁奖典礼上授予奖杯、证书和奖品的活动。旨在培养和挖掘掌握Power技术的高校人才,促进Power Systems相关产品和技术在校园内的传播和推广,为高校学生提高展示自身能力的平台

--- iSYSU ---

来源:中大校报

作者:杨靖雯 钟雨芹

编辑:Lorbs

欢迎投稿&加入我们

zhongdaguanwei@163.com

返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
免费获取
今日搜狐热点
今日推荐