存档

文章标签 ‘ASC’

Google工程师在2008年VLDB大会上关于Deep Web的演讲稿(续)

2009年6月5日 jinhe.zengjh 没有评论

网页的提交一般都是采用表单的方式,通过各种各样的表单项和组合可以形成各种各样的查询。表单的提交方式有两种,POST方式和GET方式,POST方式所有的提交网址都是同一种形式,表单内容都隐藏在HTTP的请求中一起提交的,而GET方式则每次都是不一样的。

我们可以想象每一个Form后面都有一个数据库,每一次Form的提交就类似于查询SQL语句一样:select * from DB where I1=V1 and … and IN=VN 。但是也不是所有Form中的每一个表单都是对于这个数据库是有意义的。比如:排序,分页大小的选择等等。如何得到一个非常适合的Query集合是非常关键的。

为了得到更合适的Query集合,我们想到了采用Query模版,也就是一个Query的表单集,能够迭代得到最多可能的所有的Query。对于一个卖书的商店,对应的Query集合可能如下:

<Z> {select * from DB where zip = z | z are valid zip codes }

<T> {select * from DB where type = t | t are valid store types }
<T, Z> {select * from DB where zip = z and type = t | … }

阅读全文…

阿里搜索技术研究中心定位

2008年5月7日 Rogers 没有评论

阿里搜索技术研究中心成立也有小半年了。我想我们如果想在人们脑子里面留下点什么可能需要考虑用什么角度向用户宣传搜索技术。我暂时想到的有:

首先我们需要强调的是让用户知道搜索不是只是网页搜索。因为在这个市场上我们不占优势。

其次要让用户明白我们是领先的搜索和电子商务的结合的引领者。推荐引擎,广告匹配技术这些都是搜索技术密不可分的。让用户知道在这些方面我们是专家。这是用户头脑中的空白。

PS:必须承认这些主要是受《定位》这本书的观念的影响。这本书我认为不论是从营销的角度还是企业策略决定的角度来说都十分有意义。推荐阅读。