存档

2009年6月 的存档

Are User Ready for the Faceted Search

2009年6月3日 winso0on 没有评论

Google工程师在2008年VLDB大会上关于Deep Web的演讲稿

2009年6月2日 jinhe.zengjh 没有评论

FromGoogle工程师Jayant Madhavan2008VLDB大会上的发言。

Deep Web指的是隐藏在HTML表单之后的信息内容,举例来说,对于一个网上卖书的网页来说,用户必须反复的尝试不同的值去提交表单,网站返回给用户的是一个列表展示的各种书的页面,这些内容其实都是属于Deep Web的内容。

e688aae59bbe33

阅读全文…

动态分类与向导搜索

2009年6月1日 Gregory 没有评论

动态分类是一种多维度的分类方法:一篇文档可以根据需要分在几种主题下。

分类树具有多种继承性,概念除了包含关系,还有相关关系:如果一篇文档既可以分到A概念中也可以分到B概念中,那么这两个概念就是相关的。

这个简单的规则在分类学中具有重大的意义:

1、概念之间的关系通过真实的分类就可以得到。这意味着通过动态的计算就可以获得某种事前不知道的关系,同时保持了分类的简洁性。

2、随着分类增加而带来的概念复杂性可以通过这种办法避免。

浏览和检索系统就是建立在逆向推理的规则之上。首先呈现给用户的是一个完整的分类,他选择了一个或几个感兴趣的主题,确定了一些文章作为当前的焦点。然后,他使用了变焦镜头。系统是一种简化了的分类,仅保留与当前焦点相关的概念。(当前焦点的分类集合)。简化分类中的任何概念都可以用来设置焦点和变焦镜头,用户重复这个过程直到焦点足够小,可以人工检查。

用户可以方便的达到目标。分析和模拟说明2个变焦镜头(平均有10个小项)就可以有效简化10万条信息。此外,逆向推理原则可以扩展到文档检索结果的概念集合的产生。所以动态分类可以与各种搜索相结合。

简言之,Guided Navigation就是逆向推理扩展形成概念的联系,每个概念就是一个筛选项,通过多次筛选达到可以人工选择的最佳结果范围。