盛名时刻表APP中爆出“盗数据可耻”、“数据盗用自余票信息网”字样,爆出其火车余票数据抄袭自余票网的丑闻。

数据版权争夺战硝烟弥漫 盛名时刻表被曝抄袭

来源:环球企业家  |  作者:王晨  |  阅读:

盛名时刻表APP中爆出“盗数据可耻”、“数据盗用自余票信息网”字样,爆出其火车余票数据抄袭自余票网的丑闻。余票信息网因不堪忍受盛名时刻表盗取数据,在网站数据中插入了自身的标识字段,被盛名时刻表抓取后原样在app中展示出来。可谓近期愈演愈烈的数据版权争夺战中一记漂亮的还击。
 
 
笔者今天使用ios版的盛名时刻表查询剩余火车票额,惊人的发现它的数据竞是盗用另一家名为余票信息网(yupiao.info)的小网站。因数据纠纷,余票信息网在自己的数据中插入标识字段声明版权及“盗数据可耻”字样,竟然被盛名时刻表原封不动展示出来(见图)。盛名时刻表在其帮助文章中宣称余票数据由官方来源实时抓取,并对余票查询功能以插件形式单独销售。作为苹果应用商店中top2的时刻表软件,竟然不具备从铁道部官方获取数据的能力,只好盗用其他网站的数据,实在是令人质疑其技术实力。

余票信息网在官方微博上表态,盛名盗用数据已经好几个月,但盛名不但没有合作诚意,反而宣称不觉得盗用数据有任何不妥。此番余票信息网回马一枪,在对方的app中直接注入自身的广告,可谓是一箭双雕,不但给了对手重重一击,而且做出了一次漂亮的营销。盛名时刻表只能自叹技术不如人了。
这样在数据中插入标识字段的方法,如果可以推广到愈演愈烈的网易、腾讯、大众点评等公司的数据版权之争之中,必将收到更好的效果。
 
为何余票数据如此抢手
铁道部的余票数据公布在其订票服务网站12306.cn上,这个网站不支持手机、ipad等移动设备使用,因此列车时刻方面的移动app开发者都在瞄准这个方向提供服务。据悉,12306.cn为了防止数据被获取,查询余票数据时需要填写验证码,并且该网站在查询速度过快的时候会提示“403禁止访问”。因此,大量采集余票数据不是随便某个app码农可以实现的。余票信息网的作者是一名车迷的同时,也是一名科研工作者。作者在海子铁路网等论坛中透露了一些网站的技术细节:验证码识别采用了自主开发的OCR技术,数据爬虫弹性部署在多个分布式节点上,引入遥感领域的数据同化思想对数据再加工等等。这些技术恐怕不是一般开发者乃至小公司可以掌握的。

 
余票信息网什么来历
余票信息网的页面简洁大方,上方导航栏陈列着几个主要功能:剩余票额、列车时刻、正晚点、客运里程表、水牌DIY、铁路电子地图。网站标题右侧文字“专为车迷朋友提供的铁路瑞士军刀”标明了该网站专门服务小受众专业用户。该网站没有售票相关的增值服务,也没有大量投放广告,可见是一个爱好者自发建立的非盈利网站。并且,该站并非单纯转发官方数据,而是对数据进行再分析后提供给用户。
余票信息网提供的余票查询可以一次查询几天以及全部沿途车站,正晚点也可以显示出历史正晚点统计数据,用户体验很赞。笔者认为,若是铁道部能借鉴余票信息网这几项长处,将大大提高网络售票的便捷度。

一次查询多天

查询正晚点历史数据