Category Archives: machine learning

共轭分布与共轭先验

在PRML中对于共轭分布与共轭先验有很详细的解释,但是可能因为太详细了,而且我们以前的统计教材都是基于频率学派而不是贝叶斯学派的,所以在理解这个概念时,很多人一开始都会觉得比较困难(包括我自己),其实这里的关键是要搞清楚这两个概念一起配套一系列概念,只要把这一族概念都理解清楚了,那这两个定义其实也就很容易明了了。

Posted in machine learning | Tagged , , , , , , , | 6 Comments

sklearn安装

Posted in machine learning | Tagged , , , | Leave a comment

SIGIR2014部分印象

这次参加SIGIR 2014感觉各方面收获还是蛮大的,虽然同事们都说这次会议文章水,SIGIR已死之类的。但是一来,我觉得一次学术盛会能诞生一两篇能参与架起通往未来的桥梁的文章就已经可以算完成历史使命了。人类文明的发展,科学的进步,工程的成就乃至其他很多人造的东西都不是一蹴而就的,都有一个量变到质变的过程,不积跬步,无以致千里。不用对一两篇文章要求太高。二来,在会上也见到了许多青年才俊,拓宽了不少眼界,对“学术圈是怎么一回事”这件事有了更新的认识,和更全面的了解。三者,能去澳大利亚玩一趟,我觉得还是很不虚此行的`(*∩_∩*)′……

Posted in life, machine learning | Tagged , , , , | Leave a comment

在老版本gcc下编译numpy

去年在装numpy的时候其实就遇到了这个问题,今年有同学又提出来,已经没有印象了,又重新摸索了一遍才又记了起来。

Posted in linux, machine learning | Tagged , , | Leave a comment

大数据下的数据标签与推荐技术沙龙

上周去听了一期阿里技术沙龙,感觉收获蛮大的,记录一些感想。

Posted in machine learning | Tagged | Leave a comment

机器学习概述

机器学习作为一门交叉学科,目前为止没有非常权威的定义,或者说堪称权威的人下的定义太多,目前没有一个被大家公认的定义标准。最经典的也是T.Mitchell在他的那本《machine learning》中提到的:“利用经验改善系统自身的性能。”经典到过于简短。中科院的王珏研究员给出了如下说明:“令W是这个给定世界的有限或无限所有对象的集合,由于我们观察能力的限制,我们只能获得这个世界的一个有限的子集Q∈W。机器学习的任务就是根据这个世界的对象子集Q,计算这个世界的统计分布。这样,在统计意义下,这个分布对这个世界的绝大多数对象是正确的。这就是这个世界的一个模型。”其实,人类认识的世界的方法就是通过有限的特征去猜测和拟合无限维特征构成的真实世界。所以以上的描述相对于机器学习可能又太大了一些。不过从其本质出发,机器学习其实就是人类研究世界、认识世界的方法得到机器更强的计算和存储能力扩展后的延伸。从这个角度来说之前的说明倒也贴近机器学习的最终追求。

Posted in machine learning | Tagged | Leave a comment