第一课 机器学习简介
1. 摘要
本课主要是对机器学习做一个简要介绍,包括机器学习的历史、分类及应用。作为系列第一篇,在这里我也按这三个内容做一些说明。
2. 机器学习的历史
最近几年伴随大数据时代火起来的机器学习实际上在半个世纪以前就已经开始有人研究了。在1959年,美国人Arthur Samuel第一次使用了“机器学习(Machine Learning)”这个术语,他编写了一个跳棋程序,该程序也被认为是第一个具有学习能力程序。

3. 机器学习的分类
3.1 监督学习(Supervised Learning)
百度给出的定义为:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。
我表示黑人问号。。。
说白了就是由人类给定一组标准答案,机器通过这些标准答案对目标任务进行一个推测
Ng教授给出了一个直观例子

第二个例子是一个分类问题(Classification Problem)
给定一组乳腺癌肿瘤体积和性质(良性or恶性)的数据,我们根据肿瘤 大学需要预测该肿瘤的性质。
因此,在这个问题中,我们的值域只有0和1,分别代表良性和恶性,继而得到下图。


再进一步,我们可以考虑由n个输入(n维)甚至无限个输入(无限维)组成的数据集,对于这些问题我们就需要更为先进的工具进行处理(后面的课程会讲到支持向量机SVM,就是专门处理这类问题的)
3.2 非监督学习(Unsupervised Learning)
在这类学习中,Ng同样是用一组案例来解释的。
第一个案例为上文中提到的癌症性质分类问题。
如果我们只给出关于肿瘤的一组特征(如肿瘤大小和病患年龄),而并不给出该肿瘤的性质,则我们得到的数据点应为如下样子。


第三个案例为解析照片的区块信息。
例如我们有照片原图如下



[W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');
由于是音频内容,在这里展示不能。。。也不多说了。。
3.3 增强学习(Reinforcement Learning)
增强学习通常应用于在某段时间内需做出一系列决策的情况。其关键在于设计一个 回报函数,使得系统每做出一个决定,都能根据 回报函数获得一个回报值,而整个系统的目标就是获得更高的回报值。
例如视频中提到的,编写一个程序让一个直升飞机飞起来。直升机需要做出一系列“还不错”的决策让自己飞起来。简单来说,当直升机正常飞行时, 回报函数会给出一个正的回报值,而掉下来时给出一个负值。这样经过一段时间的训练后,直升机就可以按照自己的一系列正回报值的决策来飞行了。