MLF Lecture 3 Types Of Machine Learning

Posted on 2016-07-16 Edited on 2018-01-21 Disqus:

機器學習基石(Machine Learning Foundations)笔记第二弹

Learning with Different Output Space Y

Classification

\(y=\{1,2,\dots,k\}\) (Binary Classfication \(y=\{-1,+1\}\))

将输入分成类别，作为输出。例：将硬币分成 1 美分，5 美分，10 美分，25 美分

Regression

\(y=R\)

将输入回归为一个结果，类似统计中的线性回归。例：通过公司业绩推测明日股价

Structured

\(y=Structures\)

将输入分成结构，作为输出.例：自然语言分析，分析句中单词词性

\[\begin{aligned} &\underbrace{I}_{pronoun} \underbrace{love}_{verb} \text{ }\underbrace{ML}_{noun} \\\ &\text{sentence} \Rightarrow \text{structure(class of each word)} \\\ &y = \{PVN,PVP,NVN,PV,\dots\} \end{aligned}\]

ntence} \
&y = {PVN,PVP,NVN,PV,} \end{aligned}

Learning with Different Data Label \(y_n\)

Supervised

监督式学习：每组数据都提供标签(Label) \(y_n\)

Unsupervised

非监督式学习：所有数据均不提供标签(Label) \(y_n\)

类型差别较大，应用广泛，如：社交网络文章主题归类，交通车流量密度回归分析，离群数据监测

Semi-Supervised

半监督式学习：少量数据提供标签(Label) \(y_n\)

节省获取 Label 的成本

例：药品数据效果预测（实验成本高）

Reinforcement

通过奖励或惩罚机制评价动作的好坏，产生强化信号，机器会结合当前环境，选择使将要获得的强化信号达到最大的行为模式

例：对宠物的训练

Learning With Different Protocol

batch：批量提供数据
online：在线分条序列提供数据
active：机器提问针对性获取 Label

Learning With Different Input Space

Concrete Data：数据经过人工或者机器处理，X 的每一个维度都有一定的现实意义
Raw Data：未经处理的数据，如：图像的点阵。一般需要先提取特称(Concret Feature)
Abstract Data：抽象数据，如：用户 ID、音乐库 ID