OpenStreetMap,地图的未来?

OpenStreetMap(以下用 OSM 代替)被称为维基地图,这个网络地图协作计划旨在打造一个内容自由且能让所有人共同编辑的世界地图。在 Google 地图和苹果地图的争端持续升级之际,OSM 开始逐渐浮出水面,有越来越多的服务开始使用免费的 OSM API。而基于 OSM 的移动地图方案提供商 Skobbler 创始人 Marcus Thielking 甚至认为 OSM 前途无量,最终将会击败 Google 和苹果。那么 OSM 究竟是一项什么样的服务?它真的代表着地图的未来吗?

OpenStreetMap 的起源

OpenStreetMap 由 Steve Coast 于 2004 年创建。当时这位年仅 24 岁的计算机极客的想法很简单,他只想找些地图来玩一玩。虽然已经有一些免费的地图程序和软件,但是却没有地图数据,同时很多地图图片都有版权限制,不能直接使用。于是 Coast 开始用自己的 GPS 设备收集数据,并用 Linux 笔记本写出可以上传数据和生成地图的程序。

OSM 的第一批数据是 Coast 拿着 GPS 设备,骑车环绕 Regent 公园收集到的。八年之后,包括 Regent 公园在内,世界上大部分的地图都已经在 OSM 上绘制出来。有成千上万的用户开始浏览 OSM 主站,其在 Alexa 地图类网站的排名也居于第七。除了 OSM 主站,也涌现出大量衍生网站使用 OSM 数据的第三方网站,比如白宫FlickrFoursquare iPhoto for iOS 都部分或者全面的使用了 OSM 的服务。

当然仅靠 Coast 一人的力量是远远不够的,OSM 的发展更多的依靠社群的力量。2008 年,OSM 的注册用户还只有 5 万,而截止到 2012 年 8 月,注册用户已经飙升到 70 万。此外,雅虎和微软提供的航拍图也在地图制作的过程中起到了关键作用。

如何制造 OpenStreetMap

OSM 的核心在于用户可以编辑创建地图,这个流程包括收集、上传和编辑数据、添加标签和生成地图五个部分

收集数据

用户可以通过 GPS 设备和第三方提供的免费航拍图来收集地图数据。除了专业的 GPS 设备,一些带有轨迹记录软件的移动设备也可以用来记录数据。而雅虎、Landsat 和 NPE 等也免费提供一些航拍图。在数据采集过程中,用户可以用任何他们偏好的方式(纸笔、录音机或相机等等)记录他们感兴趣的数据,比如道路名、停车场、形成方法、地铁站等。

上传数据

收集完数据后,用户需要把 GPS 中的轨迹数据导出为特定的格式,然后上传到 OSM。接下来,用户需要在 OSM 推出的 JSON 编辑器中编辑从 OSM 下载的数据。

创建/编辑数据

OSM 数据包括基本节点、带方向的路线和闭合区域。这些元素带有标签,可以描述地名和道路类型等。用户可以用各种不同的编辑器来进行创建元素、添加标签、修改轨迹弯道等操作。

编辑标签

OSM 有一套完整的标签方案。当完成一条路线后,用户需要给它加上标签从而确定这条路线在地图上的渲染效果。OSM 中的节点、路线和闭合区域都可以添加标签,标签类型有元素、默认、调整和渲染标签四种常用类型。完成编辑后,用户便可以把修改后的文件上传到 OSM。

渲染地图

用户可以在线下通过 OSM 提供的渲染工具直接生成地图,也可以在线通过 OSM 主页的工具渲染地图。之后,用户便可以随意使用这些地图了,你可以导出地图图像,或者在网站内嵌 OSM 地图,甚至制作基于 OSM 数据的地图或者应用。

OpenStreetMap 的优势

OSM 吸引了这么多的用户和网站加入他们的计划,它的魅力究竟在哪里?

免费的数据源

免费无疑是 OSM 的最大优势。OSM 的数据库采用 Open Database Licence(ODbL)授权协议,地图数据使用者可以免费使用 OSM 数据。在 Google 日益收紧地图 API 收费策略之后,包括 Foursquare 和维基百科在内的网站都纷纷转投到 OSM 门下,开始使用 OSM 提供的服务。可以说,对于涉及到位置服务的中小型创业公司来说,OSM 无疑是最好的归宿。

丰富及时的数据质量

数据是地图的基石,能否全面准确以及及时的反应实际 POI(Point of Interest,兴趣点)变化是评价地图质量好坏的标准。由于采用众包的方式,本地居民掌握着第一手资料,这些用户可以随时上传他们所知晓的最具体和准确的 POI 或者道路数据。以萨拉热窝为例,OSM 上的道路信息就比 Google 地图更加丰富。同时 OSM 的机制还可以保证这群用户及时的更新数据,从而保证地图不会过时。而对传统的依靠数据提供商的地图服务商说,不能及时提供最新和全面的数据是他们最大的短板。

自由开放的平台

除了免费高质的数据,OSM 本身也更加自由和开放。Thielking 认为,Google 有条条框框限制开发者,而 OSM 的数据基于 ODbL,制图和文档采用 CC-BY-SA(Creative Commons Attribution-ShareAlike 2.0,创作共用-署名-相同方式共享 2.0)协议,因此这个平台更有可能诞生更多有趣的东西。比如用户可以创建散步地图、登上地图、自行车地图等诸多主题地图。Waze 虽然没有采用 OSM 的数据,但是它的成功也表明,这种开源众包的 LBS 数据生产模式在未来有无限的可能。

OpenStreetMap 真能击败 Google 吗?

OSM 虽然长势迅猛,但它会成长为地图服务中的维基百科,从而撼动 Google 的地位吗?也许它的未来并没有 Thielking 所设想的那样完美。

用户活跃度不高

OSM 现在已经有近80万注册用户,可是每月的活跃用户却不到 4%,所有用户中上传 GPS 数据文件的用户比率也在不断减小。虽然本地用户对当地状况是最了解的,但是数据采集、编辑和生产却在无形中为 OSM 铸造了较高的门槛。因此 OSM 还是局限于极客团体或者开源社区,难以引起普通大众的注意。

数据不够全面

除了用户活跃度低,用户分布不均也是 OSM 的一大难题,比如 OSM 用户主要居于欧美,因此这些地区的地图可能比较完善,但其他地区则就差强人意。相反,Google 在一些地区可以购买数据,同时他们也会得到大量用户及爱好团体对 Google 地图的反馈和帮助。Google 地图每天会接到数千个用户反馈,而地图团队会在数分钟内做出应对处理。Google 也推出了自己的地图编辑工具 Map Maker,希望通过这个项目来补充和丰富已有的地图数据,并且陆续有一些数据开始整合到 Google 地图。现在 Google Map Maker 社区已经有3万左右的用户。通过自上而下和自下而上相结合,Google 地图数据的涵盖面比 OSM 更加广阔。

整体地图服务的缺失

数据是地图的核心,但是在这基础上的衍生服务同样是地图不可或缺的部分。路线查询、实时路况、街景、导航、3D 地图等服务已经开始成为地图的标配,当然 OSM 可以作为一个平台促使第三方来开发相应的功能,但是 Google 可以从整体上把握这些功能,从而在用户体验的一致性上更胜一筹。

未来发展的隐患

同样我们也不能忽视微软对 OSM 的影响。Coast 已经在微软 Bing 的地图部门履职,OSM 和 Bing 也在多个层面有合作微软希望借助开源社区来对抗 Google 地图,OSM 也希望获得微软方面的数据支持。一旦这种均衡被打破,OSM 的长远发展将受到严重影响,甚至偏离最初的路线轨迹。

Coast 的目标是将整个地球绘制出来,并使没有版权限制的免费数据给任何需要的人在网络上使用。我们无法预期他的愿景是否会实现。OSM 这种维基地图也许会成为未来地图的基本模式,同样也可能成为仅在极客团体和开源社区流行的运动。但是可以确认的是,纸质地图将会退出历史舞台,无论是 Google、苹果、Bing、OSM 或是出现一种更强大的新型地图服务,它们都能快速将我们带到想去的地方。

(首发于GeekPark

互联网如何改变学术生态?

1980年,Tim Berners-Lee供职于CERN(欧洲核子研究组织)时,为了方便研究人员分享和交流学术信息,提出了建立一个基于超文本系统的项目的想法。他因此创建了名为ENQUIRE的原型系统,这个系统可以把大量数据资料按照内容的关联组织起来,以便用户查找资料和相关文件。9年后,以ENQUIRE为雏形的万维网(World Wide Web)正式在CERN诞生。

现在,万维网已经成为互联网的核心应用,人们生活的方方面面都被彻底颠覆。不过有些讽刺的是,脱胎于学术界的万维网对整个学术生态圈却影响甚微。除了将学术论文电子化后存储到数据库,科学家们还是沿用着古老的流程从事着学术研究。

这些流程包括:科学家首先需要筹集研究经费,这些款项大部分来源于政府拨款或者私人基金。当研究完成,学者会把研究结果写成论文投递至专业的学术期刊,这些论文一般都遵循着严苛单调的格式要求。在经历漫长的同行评审之后,这篇文章才可能正式发表。当然,并不是所有人都可以共享这些最新的科研成果。只有付费给收录了相应期刊的数据库提供商,人们才有权限查看论文。

可以看到,当下的学术生态主要在这些方面存在一些问题:

  • 经费门槛:僧多肉少,很多研究可能得不到资助;
  • 同行评审:过程冗长,一篇文章从投递到正式发表平均需要6个月到2年不等;
  • 文章内容:单一的文件格式和单调的文章内容;
  • 发行体系:商业出版机构形成垄断,数据库购买费用过。

和互联网的迅猛发展相比,学术生态的变化显然有些缓慢。不过随着Academia.eduMendeleyPLOS ONE等新型学者社交网络服务、文献工具、开放期刊的兴起,我们可以展望一下学术生态圈的未来:

众筹作为科研基金来源

随着众筹平台Kickstarter的兴起,研究人员能否直接向公众募集科研资金呢?虽然Kickstarter上已经完成完成了众多的创新项目,但现在鲜有研究者通过Kickstarter筹集科研资金。一方面由于Kickstarter的申请标准是“创意项目”,必须以产品实体的形式产出,这对大多数停留在理论层面的科学研究来说是一道无法逾越的鸿沟。另一方面,科研计划能否吸引大众支持,以及给予支持者何种回馈也是一个难题。

当然现在已经出现了一些科研资金众筹网站,比如MicroryzaIAMScientistPetridish等等。他们都参照了Kickstarter模式,研究者在项目页面下介绍自己的研究内容和意义,同时列出不同支持金额下的回馈内容。回馈方式主要有实时推送研究进展、感谢信、论文中或者会议上特别致谢,以及赠送一些周边礼品等等。

从这些颇有些理想主义色彩的回馈方式来看,科研资金众筹网站还处于襁褓阶段,甚至仍局限于学者内部圈子,游离于普罗大众之外。但可以预见的是,越来越多的开放的网络教育资源将提高普通民众的科学素养,他们将会越来意识到科学与自身生活的联系从而提升对科研的认同,众筹平台因此有希望成为学术经费来源的重要渠道。这样学者们的挑战将是如何深入浅出的向网民们介绍自己的研究,并使他们感同身受,进而直接从网民身上获得资金支持。

基于网络的全民“评审”

Academia.edu创始人Richard Price曾撰文描绘了一种互联网时代的新型评审系统。这套评审系统包括群体评审(Crowd Review)和社会评审(Social Review)两部分。前者基于Google、Google Scholar和Pubmed等搜索引擎,后者主要来源于Facebook、Twitter、Academia.edu、Quora等社会化平台。搜索引擎可以使你的文章被成千上万的人阅读,二社交网络则引来你的同事或好友来审视你的作品。Price相信随着科研平台向网络迁移,搜索引擎和社交网络便能取代同行评审的功能。

有人肯定会问,这样的体系如何保证论文的质量?实际上,现存的学术期刊的质量也是良莠不齐,而几个人的同行评审也无法确保发表的论文都是精品。相反,借助PageRank、文章引用数、Facebook的分享次数或者Twitter的转发次数,我们可以直观的评价一项研究成果的好坏。如果你的文章在搜索引擎的排名越高,在社交网络中被分享得越多,你的论文的价值便越高。也就是说,搜索引擎和社交平台间接提供了评审过滤的功能,从而告别传统的浪费人力、时间和财力的评审体制。

更丰富的文本内容和格式

传统论文都是文本和图片结合的内容形式,这种展现方法显然与互联网时代格格不入。Price相信,富媒体(Rich Media)将是未来科研论文的主流。科学者们可以在论文中嵌入视频、添加各种超链接和交互特效,甚至直接和读者互动。阅读论文和学术著作一直需要较高的门槛,甚至对接受专业学术训练的学生来说也是一项大挑战。视频、图片和更多的交互方式在一定程度上可以缓解阅读过程的枯燥,比如视频可以直接还原实验过程和研究背景。

PDF是电子论文的统一格式,但是这种脱逃于传统纸媒的载体还是过于单调和笨拙,比如它会受制于屏幕尺寸。在小屏幕手机上观看PDF的体验我想很多人都感同身受。实际上,自适应的网页、跨平台的App等更适合承载论文内容,这在多终端设备横行年代显然更具有优势。

互联网直接作为垂直发布平台

PLOS(公共科学图书馆)领导的开放存取(open access)期刊运动对传统的学术期刊体系造成了一定冲击,以其2006年创立的综合学术期刊PLOS ONE为例,它的论文数从2006年的137火速飙升到了2010年的6714,而影响因子在2011年也达到了4.092。虽然学界对PLOS ONE的看法褒贬不一,但是仍然无法否认它所提倡的开放存取,即免费浏览和下载论文的革命性意义。

但是PLOS ONE仍然延续着期刊出版发行的传统,存在同行评审机制,并且依靠审稿费存活。实际上,如果科研众筹平台成熟、搜索算法和数据挖掘不断优化、富文本信息不断增多,未来科学工作者完全在可以在网络上自由发表自己最新的研究成果。比如博客日志、社交网络的日记或者问答平台的答案都可以成为一篇学术论文。而读者们也可以轻松获取这些最新的学术成就,不再支付高额的订阅费。

此外,如果依托于互联网作为发布平台,传统的用于积累个人学术权威的期刊影响因子则会逐渐转变为个人的各种网络指标。个人学术主页的UV和PV、Twitter粉丝数、Facebook被赞的次数、StackOverflow等问答社区的分数、Academia.edu社区的影响力都可以用来衡量个人的学术实力。

Price的Academia.edu近日有了新动作,开始加强社区学者的品牌管理,让学者们可以更好的展现自己的研究成果。Pirce正一步步实践打造一个开放自由的在线学术圈的梦想。也许在未来,科研的封闭属性在互联网时代会被完全打破。配合开放课程、公共课的教育资源的开放,科研界与民间的隔阂也会逐渐消融,任何人成为科学家的梦想都将变得触手可及。那么那些还呆在象牙塔的科学家们,是不是该现在行动起来,全身心地拥抱互联网呢?

(原文发于GeekPark