转译: The Future of the World Wide Web – 万维网的未来


作者:timbl 2007-03-01
原文:http://dig.csail.mit.edu/2007/03/01-ushouse-future-of-the-web.html
视频:http://energycommerce.house.gov/cmte_mtgs/110-ti_hrg.030107.WorldWideWeb.shtml
原译:http://yeeyan.com/articles/view/bean/3295

马奇主席,厄普顿成员,各位委员们。很高兴今天能够有机会站在这里来和大家一起探讨万维网的未来。我愿意和大家分享我过去设计万维网基础时候的经验,多年来研究并关注万维网成长的体会,以及万维网的未来我们将面对的激动人心而富有挑战性的工作。虽然我有幸能在九十年代中期为互联网的诞生起领导作用,但万维网早已经跨过靠个人或者某个组织的研究就能胜任的发展阶段,它已经成为许多人、团体、企业甚至政府依赖使用的公共社会资源。而且,从它诞生的那一天起,万维网就是在全球许多人的努力合作下而得以创造的媒体。

首先,我自我介绍一下。我先在牛津大学学物理,毕业的时候发现了微处理器世界,然后在计算机行业工作了几年。1980年,临时到欧洲粒子物理研究所工作(CERN),我为了工作的方便设计了一个记录项目文件间相互关系的小程序。我在1984年又重新回到了欧洲粒子物理研究所工作,这次一直在这里工作了10年之久。在这段时间里面,出于工作的需要我发现很有必要建立一个通用的信息管理系统,并于1990年附带着开发了万维网(World Wide Web)。1994年,随着万维网的迅速发展,我来到了麻省理工学院,创办了第一个国际万维网研究机构W3C(World Wide Consortium),并从那时开始一直领导着这个协会。我担任了3Com公司发明家协会主席并在那里和麻省理工学院分布式信息项目组一起从事高级Web技术的研究。我今天发布的所有观点都是我个人的想法,不代表W3C或者它的任何一位其它成员。

我们对万维网(注意:Internet和World Wide Web不完全是一个概念)的特别关注来源于民主国家悠久的渴望捍卫个人话语权的权利。我们培育并保护着我们的信息网络因为它代表了我们的核心经济体系、民主制度、以及我们的文化和个人生活。当然,允许信息在互联网上自由流动早已成为它的基本规则。正如一位联邦审判员在一次捍卫互联网话语权自由的会议上说的:“国际互联网早已不再像打印机、自由讨论区(the village green,专有词汇)、邮件只是我们言语能力的补充,国际互联网将成为全世界永不停止的对话…”

因此,我们所有人都应该理解,培育万维的持续发展,不断改革创新它的功能,保持它的活力应当成为我们每个人的职责。我很高兴美国和世界上许多民主国家已经接受了这个挑战。我希望今天能够帮助你们理解我们这个协会以及本次大会对建设万维网的重要意义。

I. 万维网的建立(Foundations of the World Wide Web)

成功的万维网,本身基于开放的互联网,它的成功取决与三个关键要素:1、网页间可以无任何约束地自由链接;2、开放的技术标准成为它能持续创新发展的基础;3、网络的分层管理,允许网络层、传输层、路由层以及应用层可以相对独立地发展创新。今天,万维网的以上特征已不再被大家关注,因为在它已经成为一个良好的自维护系统后,这些特征已经不那么重要了。这个星球上的任何一个网页都可以被接入了互联网的其它任何人访问,不管他是采用调制解调器上网还是通过速度达几兆的高速网络上网,这一点已经成为我们的共识。最近十年,启动了很多电子商务网站,它们中的一部分已经成为我们新经济的基础。我们期待着某个新的巨型网站或者你小孩的本地足球队主页能随时从互联网上轻松迸出来。

我们今天主要是谈论互联网,但不得不说明一下,万维网只是互联网上众多应用程序之一,就象互联网上的email、即时通讯、语音IP等应用程序一样,如果没有互联网这个开放的平台,就没有万维网的今天。

A. 任何人与任何页面间的通用连接(Universal linking: Anyone can connect to anyone, any page can link to any page)

万维网是如何从无到有发展成今天的规模的?从技术角度而言,Web是由巨大的、相互链接的(采用URI标准链接到其它文档)、通过互联网彼此访问的Web网页的集合(用HTML格式写成)。万维网的成长过程可用彼此链接的页面数和网上发布的页面数来衡量。仅仅15年前,万维网还只有一个网站一个页面,现在已经有超过100,000,000个网站,截止到2005年,据估算,已经有多达80亿公开可访问页面。因为万维网既没有页面的限制也没有链接数的限制,所以网页间的超链接是非常容易实现的,而且增加网页没有任何限制,基本上是零费用。更何况,我们采用的是非歧视性访问跟踪协议(HTTP),它允许我们跟踪所有的链接,不必考虑它的内容或者所有权。所以,因为网页制作简单、容易链接和访问,人们在这个领域已经做了大量的工作。增加一个内容页面,并添加上链接到提供内容的组织,对万维网上的信息适当加以签注,并调整它的结构,万维网就成了一个极具信息提供价值的整体。

Blog(网志或译为博客)是在万维网上低成本阅读、书写、并能相互链接的经典案例。Blog在5年前还几乎不存在,而现在正在迅猛蔓延,并几乎成为人们企图表达一切想法的工具,内容从政治到本地新闻、从艺术到科学,几乎无所不包。低成本的出版和丰富的链接能力聚合到一起,以Blog为主要代表,将产生一个自由表达和交流的平台。这种能把任何信息传送到任何其它人的通讯系统看上去很像我们赖以生存的其它基础设施:邮政系统、道路系统,以及电话系统。它也和那些封闭的系统形成了鲜明的对比,例如广播或者有线电视系统。这些封闭的系统虽然对我们也有着重要的作用,但他们对社会的影响和万维网相比是不同的,而且没有万维网普及和深入。

万维网广泛而灵活的链接体系让它具备了一个独特的能力,可以跨越空间的距离、语言的差异以及地域知识的差别。传统壁垒在万维网自然消解,因为那些隔离传统媒体的障碍根本影响不了网页链接的复杂性和成本。制作一个指向美国商业法规的链接和制作一个指向中国的商业法规同样容易,而且和从麻省引一个到密西根的链接一样简单。尽管需要跨越空间的距离、不同的网络设备、计算机操作系统甚至许许多多的其它传统信息屏障,超链接仍然能够正常工作。正因为万维网出色的超链接能力,所以我们称它为数字化空间,而不是仅仅把它当作简单的网络。其它的开放系统,例如邮政、道路或者是电话都承担了一个超越它们本身简单技术特征的社会服务功能。通过这些系统,电话可以从有线服务无缝跨接到无线供应商,邮件,可以从一个国家顺畅地穿越过境,我们买的汽车可以在我们能看到的任何道路上行驶。建立开放的基础设施成为我们将基于它建立大型社会系统的常识。而万维网又在开放性方面更进一步,它不断创新并推出新的服务把全球规模的信息整合起来,这在以前都是不可能做到的事情。这个基本的规则正是让万维网能够不断创新并永远持续发展的核心动力。

B. 开放的基础架构驱动信息创新(Open Foundation for Information-driven Innovation)

万维网现在已经不仅仅是一个自由交流思想的区域,它已经成为可以让我们在各个领域,创造各种神奇的新服务的平台。因为万维网是由开放的、标准化的免费技术组成,类似eBay、Google、Yahoo以及Amazon.com这样的网站只是万维网在电子商务应用方面的几个案例而已,还有无限多的创新应用等待着我们去挖掘。无论是开发拍卖网站、搜索引擎还是一种新的网上售物系统,我们的电子商务企业家们都会对他们提供的新服务充满信心,因为任何接入国际互联网的用户,只要有一个Web浏览器,不管他们采用何种操作系统,什么样的计算机硬件或者是哪个ISP服务商,都能轻松使用他们的服务。万维网同样能促进非商务活动或者政府部门的创新,例如Thomas曾经通过万维网来推动立法机关的工作流程更加开放和透明,维京百科(Wikipedia)已经成为合作并分享知识的先锋。开放而灵活的Web标准让万维网这个媒体成为各位一个异常强大的服务构建平台,甚至是那些残疾人士也可以像普通人一样利用它获取自己想要的内容,而不是像以前一样只能得到别人为他们准备好的信息。

基于Web基础的许多新应用及服务能带给我们一个深刻的启发,只要我们有一个拥有开放技术标准的平台,一个灵活、可扩展的架构,还有使用这些标准的免版税条件,我们就能不断推出改革与创新。在我们W3C协会,我们只会标准化那些支持免版税的技术,所以,我们要求任何为W3C开发技术标准的人员都能为开发这一标准所涉及的相关技术专利都能提供免版税的专利许可。让我们比较一下苹果公司非常成功的iTunes和iPod的音乐发布模式。这种集成了硬件、软件、Web服务的商业模式是一个集私有技术及开放标准为一体的混合体。iTunes环境由两个部分组成:音乐、视频销售和播客发布。为了保护版权,苹果公司利用他们私有的技术搭建了音乐销售平台。然而,由于苹果公司采用了封闭的、非标准的技术来实施版权保护(被称为数字版权管理),其成长性受到了局限。事实上,苹果CEO乔布斯最近声称,由于缺乏访问DRM的开放技术,在线音乐销售市场受到了局限。iTunes的播客部分却在以戏剧性的速度成长,因为它为许多大小语音或者视频发行人提供了在网上分享或者销售产品的方法。与音乐及视频销售不同的是,播客是基于开放的标准,从而确保它能容易生产、编辑并发布。

C. Internet的分层技术(Separation of Layers)

17年前,我设计了Web,并不需要获得任何人的许可,也不需要对现有互联网做任何修改,Web就作为一个新的互联网应用而迅速在互联网上普及开来。这得益于国际互联网的天才设计,当然这不是我的功劳。由于采用了可交换部件及相对隔离的经典设计思想,基于Internet的任何组件及应用程序都能被独立开发和拓展。Internet的这种分层技术允许我们可以同时在它的各个层面独立地进行技术创新。在一个工程师团队致力于开发最好的无线数据服务时,另一队人却正在研究光纤通讯中的数字压缩技术。与此同时,像我这样的应用技术开发人员能够开发像语音IP、即时通信、P2P网络这样的新协议及服务,基于国际互联网的开放设计,以上技术都能像一个整体一样协同工作。

II. 展望未来(Looking forward)

刚刚给大家描叙了Web的发展历史,下面我们来思考一下它的未来。我希望我已经让您明白Web的发展绝不是靠任何个人的力量,不是我,也不是任何其他人。我想强调在以下三个领域中,有值得期待而令人兴奋的发展。首先,Web在帮助我们管理、集成,以及分析数据方面,将会做得越来越好。今天,Web能非常有效地帮助我们出版以及发现文档,但是,包含在那些文档中的独立信息单元(尽管它们也是某个特定事件的数据,例如目录中的价格项,或者是数学公式)都不能直接作为数据而处理。今天你能通过浏览器看到这些数据,但是你无法让其它计算机程序操纵或者分析它们,除非你自己进行大量的手工干预。如果这个问题能得到解决,我们相信万维网看起来将成为一个整体,就像是一个巨大的数据库或者是电子表格,而不再只是一堆相互链接的文档集合;其次,万维网将能通过各种不断增长的网络来访问(无线,有线、卫星等等),也能通过各种不断增加的设备来访问;最后,作为一种发展趋势,Web应用将会在整个人类社会变得越来越普及,墙壁、汽车仪表、冰箱门,都将成为我们通向Web的窗口。

A. 数据集成(Data Integration)

数字化信息正在我们身边以令人惊诧的速度发展。这些信息里面隐藏着许多非常关键的知识,例如怎样治疗疾病、如何创造商业价值、以及如何更有效地治理我们的世界等。好消息是在信息共享实践领域的许多开放的技术革新(RDF对数据表达的作用等同于文档中的HTML语言,Web本体语言(OWL)允许我们解释数据是如何连接到一起的)正推动我们的万维网向语义网方向发展。曾经让万维网非常成功的链接技术,将成为解决数据集成问题中的关键技术。Web今天的强大功能,包括我们正在研究的页面搜索技术,都基于这样一个事实,所有放到Web上的文档都按照标准格式并且已经被链接到一起。语义网将带来更好的数据集成,它允许每个人把自己的数据按照标准的数据格式和任何其它人的数据进行链接。

全球在商业或者学院研究中产生的巨大数量的研究数据与停滞不前的药品发明之间的巨大反差,可以帮助我们认识更好的数据集成对我们的价值。尽管市场及其它因素能对药品的研制产生重要作用,但生命科学研究人员最近发现,在许多情况下没有单一的实验室,没有任何一个图书馆,没有一个单一的基因数据仓库能够包含足够的资料来帮助我们发现新的药物。相反,那些能帮助我们理解人体内疾病和生物过程复杂的相互作用,以及各种各样的化学机制的有用信息,却分散在世界各地无数的数据库、电子表格以及文档之中。

科学家们并不是唯一渴望能更好地进行数据整合的人。设想一下在投资以及金融领域,在这里利润的产生,在很多程度上取决于在正确的时间获得正确的信息,并能通过对信息的分析和提取,做出正确的判断。成功的投资策略,取决于能从来自于各种不同信息源(新闻、市场数据、历史趋势、日用品价格等等)的繁杂信息中发现好的商业模式以及发展趋势。领先的金融信息服务商现在正在开发允许用户在自己的投资组合或者内部市场模式中轻松集成数据的信息服务。这种服务的价值就是服务集成,不是源数据本身甚至那些工具软件,其中大部分服务都建立在基于开源代码的组件上。

新的数据集成能力,将会在个人信息领域,诱发出和现有隐私相关法律条款的挑战。今天的Web技术已经可以披露非常多的个人信息,行为、阅读兴趣、政治观点、个人社团、党派团体甚至健康和财务状况等信息都可能在网上被披露出来。在某种情况下,这种信息的获得是通过对万维网上现有的各种零散信息智能整合而成;而另一种情况,虽然这些信息是由个人自己在网上披露的,但他们只是在特定的情况下针对特定的人群暴露了自己的信息。我们应当从社会以及法律生活的角度对这一类型的个人信息暴露给予严重关注。尽管这一情形还刚刚开始,但我们应该着手研究一系列法律和技术方案来维护我们未来的基本隐私和价值观,避免将来过度滥用新的信息处理和共享能力。我们在MIT的研究小组正在研究一项新技术,让语义网的主要部分,作为技术和公共政策的模型,在万维网或者其它大型信息系统中能帮助我们改善透明度及责任心。我们的信念是为了捍卫隐私以及其它公共政策的价值观,我们需要研究并开发新的技术机制来提高信息在系统中使用的透明度,并能问责那些使用信息的人能遵守通常的规则。

B. 网络的差异化及设备的独立性(Network Diversity and Device Independence)

今天我们已经可以通过各种不同的设备跨越不同的网络访问万维网,以前,我们仅能通过Macintosh电脑,Windows PC或者是基于Linux的电脑访问它。长期以来,我们使用万维网的主流模式就是通过一些很大的显示器,从台式机或者笔记本电脑访问网站。越来越多的情况是,人们将使用有着更大或者更小显示器的非PC设备,通过不断增长中的不同的网络来访问国际互联网。在网络的这一段,可能是一个更像手机的设备,而另一端,可能是一个像大型电视机一样的设备。显然,我们会遇到把Web页面同时在17寸显示器和2到4寸基于移动电话或者PDA设备显示器展现的技术挑战。其中有些问题我们可以通过一些现有的技术标准来解决,而有些问题则依赖于新用户界面技术的创新。这一切意味着,更方便和更多机会的网络服务将能使人们可以在任何地方使用万维网,而不会仅仅局限在办公桌旁。

访问Web网络以及Web应用程序的增长蕴藏着很多重要的机会。例如,更强劲、冗余的网络服务和基于社区的社会网络的创新应用正在一些像紧急援救和通知这样的领域扮演着日益重要的角色。人们建立通讯网络支持紧急救灾的报道仅仅是从这些开放、灵活的互联网和万维网服务获益的一个证明。这个领域是我们今天正在讨论的许多问题的一个缩影,因为要想很好地协作需要无缝地集成各种不同类型的数据,马上把数据针对无数不同的Web设备转换成有效的格式,包括适当的标题,描叙以及其它需要的访问信息。我想鼓励所有的网站设计师设计的作品不仅要符合W3C标准,还要为那些残疾人员,或者是移动访问提供访问指引。

C. 无处不在的Web应用(Ubiquitous Web Applications)

在将来,Web将看上去无处不在,不会局限在在我们的桌面或者移动设备中。随着LCD技术变得日益廉价,房间的墙面甚至建筑外墙,都将成为显示Web信息的显示器。我们今天需要通过数据库或者电子表格等特定应用程序获得的许多信息将直接从网页取得。深入而普及的Web应用程序将带来创新和实现财富的大好机会。他们也引起了重要的公共政策挑战。几乎所有的信息都能以语音的形式展现出来,而且还会以儿童都能容易接受的方式,除了那些正在发生的公共事件,其中一些仅涉及到个人的信息将引发隐私问题。最终,因为新的Web将在公众生活中无处不在,它将改变我们工作的空间、商场环境、政治行为甚至我们的社会活动。

D. Web将不断发展(The Web is Not Complete)

Web在由文档页面向数据页面进化的成绩已经令我非常满意了,但,这并不意味着Web发展的终结。

Web,上面发生的一切事情都基于两个因素:技术协议和社会公约。技术协议,例如HTTP和HTML,决定了计算机之间如何交互;社会公约,例如链接到有价值资源的激励,或者是在某个社交网络中的约会规则,都和人们喜欢做什么,以及能做什么的社会约定密切相关。

虽然Web经过12年的普及推广已经得到广泛应用,我们仍然对它涉及的复杂技术及社会机制知之甚少。在Web设计、操作及它对社会的影响力方面我们仍然只知道一些浅层次的知识,缺乏对它的深入科学研究和了解。强大的技术设计,创新的商业经营决策,以及有效的公共政策的制定,都需要我们认识技术和社会机制的复杂相互作用。我们把这门学问称为:Web科学,一门专门研究大型系统的普遍规律的科学知识与工程技术。为了激发人们在Web科学领域的研究和教育兴趣,麻省理工大学(MIT)和南安普敦大学在英国建立了Web科学研究中心(WSRI,Web Science Research Initiative)。我们在一次由国际顶尖计算机科学家、社会学家以及法律学者参加的国际科学咨询会上达成了共识,WSRI将建立智力基础、教育氛围和资源基础,帮助研究人员认真把Web作为科学查询及工程技术创新领域的重要研究对象。

III. 总结(Conclusion)

那么,为了拥有一个更美好的社会,我们该如何规划我们的未来呢?

我们保证未来的技术协议或者社会约定都会遵从以下的基本价值观:Web仍然会是一个属于全世界的平台,独立于任何特定的硬件设备、软件平台、语言、文化或者残疾人士,Web将不会受控于任何一个公司或者国家。

通过坚持这些原则我们能保证未来的Web技术,例如互联网,将继续为催生伟大成就而提供基础服务。Web的卓越天性将能对你的未来工作提供良好指引,社会大众能够信赖持有这些价值观的你将具备卓越的能力,这是我的希望,也是Markey主席,以及在座的位会员会成员们的希望。很高兴今天能出现在大家面前,我也希望我能帮助您在未来能取得成功!

Skip to main content