存档

文章标签 ‘推荐引擎’

群体智慧和个人观点与推荐系统

2009年6月4日 Ronaldo 1 条评论

本文是翻译的:

我说过N次,搜索的王道是理解用户意图。一个只有两三个词的搜索语句,因为语言本身的复杂语义,不足以让搜索引擎提供相关的,有用的结果。但是现在,我们有了解决这个问题的方法,搜索方面的竞赛给我们提供了在关键词搜索顶部消除关键词语言干扰的层,而且有较多方法来实现。

接下来,我们看看Baynote是通过什么样的方法来消除搜索词的歧义的。我们有机会跟Baynote的营销总监 Mike Svatek交流,向他咨询Baynote在这方面的做法。
阅读全文…

分类: 网络&电脑 标签:

根据用户形为来发现垃圾信息

2009年6月4日 Ronaldo 没有评论

这两天看了一些对于垃圾信息的处理,对于推荐系统来说,大量的数据收集,其中也包括如何去理垃圾信息。同样是一篇paper,作者邮箱:yiqunliu@tsinghua.edu.cn,没有全部翻译,只选了较重要的部分,内容如下

对于网络中爆炸性增长的各种信息,搜索引擎在人们日常生活中的地位变得越来越重要。根据调查的结果(当然,大家也都知道),绝大多数的搜索用户只看结果列表中的前几条结果,所以,大多数信息和服务提供者都希望自己的内容能尽可能的排名靠前,以便能得到用户更多的关注。网络垃圾信息,可以定义为“相对网页的真正价值,任何不合理的提高相关性和评分的网页”。因为垃圾信息会对用户获取信息时造成障碍,垃圾信息的侦测被当成搜索引擎的一个主要的挑战。
目前,反垃圾信息的技术通常利用页面内容和链接的特点来分级并确认垃圾页面。当有垃圾信息出现在搜索结果列表中时,工程师会检查这种垃圾信息的类型和特点,然后设计具体的对策。然而,每当一种垃圾信息被处理,垃圾信息的制作者们就会想办法创建新的信息。根据这样的方法,垃圾信息处理技术只能识别已经定义过的信息,或者是已经造成了严重损失的情况。
相对于普通的防垃圾信息方法,我们提出一种新的防垃圾信息方法框架,在此框架上,有垃圾信息的网站会被事先标记出来。因为我们考虑欺诈的动机优先于页面的内容和链接。我们通过用户行为的统计分析介绍三种特性,然后设计一种基于学习的方法来与用户行为特点相结合,来定义垃圾信息。

阅读全文…

Study B2B Recommendation System(论文翻译)

2009年5月25日 Ronaldo 1 条评论

amazon,netflix,mybuys,baynote等等,这些公司或网站的推荐系统,都各有各的特色和长处,但大多都是应用在B2C的领域,个人考虑,B2B和B2C的推荐系统是有比较明显的区别的。

B2C 类网站,推荐系统类似于一种推销员,把货物卖给用户,最终的目的,是形成购买形为。B2B类网站,更重要的是强调用户的粘性,建立网站平台在用户心中的品牌和认可度。用户组成主要为买方,卖方,中间商。最终目的,要考虑到用户的不同利益,从而使用户既能达到交易目的,又能对网站平台产生强烈的认可度。
除了考虑用户特征,也需要同时考虑到用户形为和实际的商业规则。(比如:B2B的用户可能不会同意在自己的产品页面推荐同行其它企业的产品) 所以,特意从这方面出发思考了一下。

在网上搜索后,看到了这篇比较老的论文,看完后整体的感觉并不是很好,但是有一些对于B2B推荐系统价值点的挖掘,还是值得思考的。毕竟对于B2B的领域,推荐系统不仅仅是用来专门推荐商品用的,需要尽可能的满足制造商,供应商,经销商,零售商,中间服务商,等等这些不同角色的利益,这样才能使用推荐系统发挥最大的功效。

阅读全文…

基于实时行为的推荐技术会超越亚马逊吗?

2009年5月21日 Ronaldo 2 条评论

Baynote是众多的推荐技术提供商之一,也允许它的产品被贸易公司所使用。正如我们在标题所看到的,Baynote的特点在于它强调实时的用户行为分析,这也是它声称 超越“亚马逊–第一代推荐引擎”的技术。到目前为止,我们知道有很多致力于推荐引擎的公司,例如amazon和netflix,他们采用不同的创意和方 法来搭建推荐引擎。我们和Baynote的创始人兼CEO –Jack Jia进行了交流,看看我们大家有什么理由相信Baynote采用的技术会超越amazon

Baynote专注于分析当前的团体行为用来产生推荐,它故意弱化对于过去用户行为的分析,比如:page views和购买历史

Baynote公司的定位是对抗“推荐之王”Amazon(目前大家都这么称呼amazon),Jia在谈话中提到,Amazon是第一代推荐引擎,因为 它很大程度上仍然依赖于于协同过滤。Jia指出,协同过滤太专注于用户过去的数据分析,这种方式不足以说明用户当前的形为,而Baynote正在用户当前 形为方面做一些工作

Jia在谈话中介绍到,Baynote观察用户在网站实时的行为,并且希望从中得到隐藏的,自然发生的形为数据。 Baynote用到群体的智慧和相似度引擎(我觉得翻译成亲和力引擎也许更适当一点)来分析数据。这些被用来分析的公共形为包括网页跟踪,搜索Query,鼠标移动,在网页停留时间,网页浏览行为

阅读全文…

Mybuys的推荐服务

2009年5月21日 Ronaldo 没有评论

mybuys.com是一家专注于为零售网店提供推荐服务的公司,之前的文章里提到过,所以特意去仔细了解了一下

我 们知道,每个推荐系统可能都会采用不同的方法,mybuys与其它系统的区别,在于它是以一种服务的方式出现,而且不是基于某一个算法。大多数推荐系统都 有一种核心算法,然而,Mybuys对于不同的情景和不同的零售种类使用了很多种算法。从根本上来说,Mybuys卖的不是产品,而是服务。

Mybuys完全专注在零售业的推荐,从这点来看,很像沃尔玛之类的超市推荐。不过从另一个角度来看,实际上推荐系统就是在做这样的事情,使用用户在买一个商品的时候,很可能也买另一个。

阅读全文…