存档

文章标签 ‘Google’

Google工程师在2008年VLDB大会上关于Deep Web的演讲稿(续)

2009年6月5日 jinhe.zengjh 没有评论

网页的提交一般都是采用表单的方式,通过各种各样的表单项和组合可以形成各种各样的查询。表单的提交方式有两种,POST方式和GET方式,POST方式所有的提交网址都是同一种形式,表单内容都隐藏在HTTP的请求中一起提交的,而GET方式则每次都是不一样的。

我们可以想象每一个Form后面都有一个数据库,每一次Form的提交就类似于查询SQL语句一样:select * from DB where I1=V1 and … and IN=VN 。但是也不是所有Form中的每一个表单都是对于这个数据库是有意义的。比如:排序,分页大小的选择等等。如何得到一个非常适合的Query集合是非常关键的。

为了得到更合适的Query集合,我们想到了采用Query模版,也就是一个Query的表单集,能够迭代得到最多可能的所有的Query。对于一个卖书的商店,对应的Query集合可能如下:

<Z> {select * from DB where zip = z | z are valid zip codes }

<T> {select * from DB where type = t | t are valid store types }
<T, Z> {select * from DB where zip = z and type = t | … }

阅读全文…

Google Squared,期待它的潜力

2009年6月4日 Rogers 1 条评论

Google Squared已经不仅仅是Searchology上的一段视频的介绍了,我们可以在Google Labs里面实际体验它了。体验了几个Query之后未免有些失望。从数据量和准确性来说都不尽如人意,只是有一个很好的Idea。例如你可以搜索“digital cameras”,然后Google会给你将网页的数据以表格的形式格式化处理好,供你来对比。而且你还可以根据自己的需要增加对比例。比如增加Brand,Pixel Resolution等等。值得一提的是在增加Columns的时候提示的内容显然是根据Query来的,例如输入字母P的搜索digital cameras提示的是Pixel Resolution,而US presidents的时候提示的则是Political Party,这做的还是挺厉害的,和我们要搞的Navigation可能有相通的地方。只不过有时候没有值而已。不过我想在Google强大的数据挖据的能力的支持这个产品还是蛮有潜力的。

Google AutoSuggestion 功能升级

2009年6月4日 Rogers 没有评论

Google升级了在海外的Auto Suggestion功能,简单的说增加了如下几个Features。记录下,便于今后产品改进时候学习。

  • 改进了在结果页的搜索框也增加了Auto Suggestion的提示逻辑。之前是根据输入的内容提示,改进后根据当期页面结果的内容进行提示。比如在首页输入M,提示的会是Myspace之类的热门Query,但是在结果页以介绍Mp3为主的页面提示的则可能是Mp3相关的Query优先推荐。
  • 加入个性化推荐的内容。这部分内容来自于Web History的里记录的内容。同时你可以通过上面提供的remove功能删除。

personalized-suggest

  • 增加了导航类的提示。这点之前我们在雅虎的Suggestion里面也增加过。有道也有过这样的功能。
  • 在Suggestion里面增加了广告。目前处于Beta的阶段。

sponsored-link-in-suggest

其实对于这个区域还有很多更花哨的方式,今后有机会再一一列举。

Google工程师在2008年VLDB大会上关于Deep Web的演讲稿

2009年6月2日 jinhe.zengjh 没有评论

FromGoogle工程师Jayant Madhavan2008VLDB大会上的发言。

Deep Web指的是隐藏在HTML表单之后的信息内容,举例来说,对于一个网上卖书的网页来说,用户必须反复的尝试不同的值去提交表单,网站返回给用户的是一个列表展示的各种书的页面,这些内容其实都是属于Deep Web的内容。

e688aae59bbe33

阅读全文…

翻译Deciphering Mobile Search Patterns A Study of Yahoo! Mobile Search Queries

2009年5月26日 winso0on 没有评论

摘要:
在本文中,我们研究的从移动设备中使用各种的Yahoo ! oneSearch应用程序.在2007年下半年一二个月期间,来自20 万英语示例查询所提交的来自美国, 加拿大,欧洲和亚洲用户的查询模式特点。我们研究的查询分布专题类的queries的规律寻找新的趋势。我们比较和对比搜索模式之间的美国与国际的查询,以及问来自不同的搜索界面( XHTML中/的WAP , Java,插件,和SMS )之间的queries 。我们还比较我们的研究结果与以前的研究,只要有可能,无论是确认前结果,或找到在查询中的分布有趣的差异。

关键字:
Mobile query analysis, mobile search, query analysis, querylog analysis, mobile applications, wireless devices, mobiledevices, cell phones, personal devices, oneSearch
正文:
Section1. 引言
无线用户数正在迅速增长,对比日益增长的人口的移动用户,可以预计,通过手机上网的用户也将飞速增长。事实上,我们可能已经进入大规模通过无线手持设备接入互联网的早期阶段。最近,包括电子邮件和地图等互联网应用使用,已日益增长。

阅读全文…