MLF Lecture 3 Types Of Machine Learning
機器學習基石(Machine Learning Foundations)笔记第二弹
Learning with Different Output Space Y
Classification
\(y=\{1,2,\dots,k\}\) (Binary Classfication \(y=\{-1,+1\}\))
将输入分成类别,作为输出。例:将硬币分成 1 美分,5 美分,10 美分,25 美分
Regression
\(y=R\)
将输入回归为一个结果,类似统计中的线性回归。例:通过公司业绩推测明日股价
Structured
\(y=Structures\)
将输入分成结构,作为输出.例:自然语言分析,分析句中单词词性
\[\begin{aligned} &\underbrace{I}_{pronoun} \underbrace{love}_{verb} \text{ }\underbrace{ML}_{noun} \\\ &\text{sentence} \Rightarrow \text{structure(class of each word)} \\\ &y = \{PVN,PVP,NVN,PV,\dots\} \end{aligned}\]ntence} \
&y = {PVN,PVP,NVN,PV,} \end{aligned}
Learning with Different Data Label \(y_n\)
Supervised
监督式学习:每组数据都提供标签(Label) \(y_n\)
Unsupervised
非监督式学习:所有数据均不提供标签(Label) \(y_n\)
类型差别较大,应用广泛,如:社交网络文章主题归类,交通车流量密度回归分析,离群数据监测
Semi-Supervised
半监督式学习:少量数据提供标签(Label) \(y_n\)
节省获取 Label 的成本
例:药品数据效果预测(实验成本高)
Reinforcement
通过奖励或惩罚机制评价动作的好坏,产生强化信号,机器会结合当前环境,选择使将要获得的强化信号达到最大的行为模式
例:对宠物的训练
Learning With Different Protocol
- batch:批量提供数据
- online:在线分条序列提供数据
- active:机器提问针对性获取 Label
Learning With Different Input Space
- Concrete Data:数据经过人工或者机器处理,X 的每一个维度都有一定的现实意义
- Raw Data:未经处理的数据,如:图像的点阵。一般需要先提取特称(Concret Feature)
- Abstract Data:抽象数据,如:用户 ID、音乐库 ID