姓名:
位置: Beijing

星期一, 十月 31, 2005

Google Base:Content Provider (转)

Google Base:Content Provider
Google Base亮了一下像,又闪了。根据官方的解释,它就是一个用户提交内容的系统,即用户可以自行创建数据库从而使得自己的内容可以被索引并被搜索到。至于Google Base的用途,比较众说纷纭,大概有这么几种说法:
作为分类信息(Classifieds):Steve Outing认为,Google将会尝试的是一种类似于Criaglist甚至是Ebay那样的模式,提供一种信息发布系统。同时它也指出Google Base相比较而言会显得“静态化”一些,没有人气旺盛支撑的话这样的社区走不了多远。
提供原数据:Webleon认为,利用Google Base收集原数据,通过API“将数据进行获取-整理-再发布”到第三方服务中,这有点类似于Ning的形式
语义网(Semantics Web):Sayonly认为,“这是google在作一次SW的试水”,即这部分数据转化为可为语义互联网的形式,从而对互联网的信息进行更高精确度的匹配。从这个角度上看,Google所做的,只是借助SW对自己既定目标的延伸而已。 在翻译那篇关于Web2.0的十八句名言”的时候,我印象最为深刻是这么一句:“在5到10年内,媒体的价值将存在于那些培养用户的公司,而不是那些控制内容的公司”。那我们回过头来看一看那些Content Provider的模式:最早就是像Hao123这样的网页目录。这种最早的对于互联网信息聚合的手段,是Yahoo最先开始的。它在数据信息显然不够丰富的时候,通过若干编辑的人工筛选实现了信息最优化。接着则是搜索引擎的方式。利用Bots,机器开始自动的检索静态网页的内容并将它们索引起来供人搜索,机器、数据库和表达式开始担任其原来编辑的责任。它所遇到的最大敌人就是Spam,其根本原因在于搜索的内容是孤立的,不是语境化的(Contextualized),它无法从内容本身而对网页进行评估,而只有通过Page Rank这样的反向链接技术。现在用户将成为内容提供方,这最大的优点在于,它有可能产生自我甄别的机能。正如Kevin Kelly在那篇“We are the Web”中所说的,通过一个类似于神经网络的构造,未来的Web的行为模式产生于我们每个人中间,即我们的每一个动作,每一次点击都将是在培育一个超巨大的AI机器:互联网。在这里,终端原数据具有的是无以比拟的智能化和结构优化。这样一来,整个Content Provider的模式从人工走向机器,再从机器走向人工,在这个从静态数据到动态数据转化的过程中,不断的得到提高的是信息的整合度和数据的结构化。所以无论Google Base最终的应用方向在哪里,它都是Google这家眼光长远的公司迈向未来信息检索和内容提供模式的一个重要的跳板。我们之所以敬佩Google,不仅仅是因为它不作恶,而是在于它能敏锐的捕捉信息发展潮流,勇敢的做那个吃螃蟹的人。

0 Comments:

发表评论

Links to this post:

创建链接

<< Home