MLF Lecture 3 Types Of Machine Learning

機器學習基石(Machine Learning Foundations)笔记第二弹

Learning with Different Output Space Y

Classification

\(y=\{1,2,\dots,k\}\) (Binary Classfication \(y=\{-1,+1\}\))

将输入分成类别,作为输出。例:将硬币分成 1 美分,5 美分,10 美分,25 美分

Regression

\(y=R\)

将输入回归为一个结果,类似统计中的线性回归。例:通过公司业绩推测明日股价

Structured

\(y=Structures\)

将输入分成结构,作为输出.例:自然语言分析,分析句中单词词性

\[\begin{aligned} &\underbrace{I}_{pronoun} \underbrace{love}_{verb} \text{ }\underbrace{ML}_{noun} \\\ &\text{sentence} \Rightarrow \text{structure(class of each word)} \\\ &y = \{PVN,PVP,NVN,PV,\dots\} \end{aligned}\]

ntence} \
&y = {PVN,PVP,NVN,PV,} \end{aligned}

Learning with Different Data Label \(y_n\)

Supervised

监督式学习:每组数据都提供标签(Label) \(y_n\)

Unsupervised

非监督式学习:所有数据均不提供标签(Label) \(y_n\)

类型差别较大,应用广泛,如:社交网络文章主题归类,交通车流量密度回归分析,离群数据监测

Semi-Supervised

半监督式学习:少量数据提供标签(Label) \(y_n\)

节省获取 Label 的成本

例:药品数据效果预测(实验成本高)

Reinforcement

通过奖励或惩罚机制评价动作的好坏,产生强化信号,机器会结合当前环境,选择使将要获得的强化信号达到最大的行为模式

例:对宠物的训练

Learning With Different Protocol

  1. batch:批量提供数据
  2. online:在线分条序列提供数据
  3. active:机器提问针对性获取 Label

Learning With Different Input Space

  1. Concrete Data:数据经过人工或者机器处理,X 的每一个维度都有一定的现实意义
  2. Raw Data:未经处理的数据,如:图像的点阵。一般需要先提取特称(Concret Feature)
  3. Abstract Data:抽象数据,如:用户 ID、音乐库 ID