机器学习概论

机器学习   2023-09-03 15:59   107   0  

网课推荐

· 吴恩达(Andrew Ng)

· 主页机器学习教程深度学习教程

· 李宏毅(Hung-Yi Lee)

· 主页机器学习教程

人工智能 vs. 机器学习

· 人工智能(Artificial Intelligence)与机器学习(Machine Learning)没有严格的定义。

· 人工智能包含了机器学习。

· 一般来说,人类让某个事物拥有智能,该事物就是AI,一般我们都指的是机器。

· 一般来说,只要一个机器能自我学习,那就是机器学习。

机器学习的本质

· 机器学习的本质是寻找一个函数(Looking for a function)。

· 如果要做股票预测,就需要找到一个函数,输入是历史股票数据,输出是预测未来的股票数据;如果要做图像识别,输入就是一张图,输出就是这张图对应的分类。

30378_icl0_5235.png

机器学习的框架

· 对于要完成某一个任务,要选择一类合适的函数,不同的任务要选择不同的函数。这是一个经验之谈,需要有一定的经验才能选择适合的函数。

· 在选择了函数之后,还需要在该种类的函数中,选择最好的那一个。如下图中,很明显f1的识别效果要比f2好得多,因此肯定不选f2

31453_4zzu_7966.png

· 在机器学习中,我们用模型(Model)代指函数。

· 机器学习中,数据是很重要的,用于给模型进行学习的数据被称为训练数据(Training Data),训练数据包含两部分,分别是输入部分(如下图中的图片)和输出部分(如下图中的标签,即正确答案)。

31759_ozss_2969.png

· 接下来,我们需要评估一个模型(函数)的好坏(Goodness of function F),我们会规定一个损失函数(Loss Function),使用这个函数,我们可以评估每一个函数f1、f2...fn)的好坏,从而让我们能选出一个最好的函数。

· 最后,我们需要优化算法(Optimization),因为我们想加快搜索的速度(如减少搜索空间),但这不是必须的

· 总结一下,机器学习的框架如下:先找到一些训练数据,然后选择一类合适的模型,然后对这类模型进行一个个的评估,找到最好(较好)的一个,最后测试

32603_9aqp_2829.png32866_dv7v_4264.png

· 上述经典框架其实在现在只适用于监督学习(Supervised Learning),现在还有很多变种,如零样本学习(Zero-shot Learning),就不需要准备数据集。

机器学习的分类

· 监督学习(Supervised Learning),如回归(Regression)与分类(Classification)。

· 无监督学习(Unsupervised Learning),如聚类(Clustering)与降维(Dimensionality reduction)。

· 集成学习(Ensemble Learning),即用多个模型来实现一个需求。

· 强化学习(Reinforcement Learning),即从环境中收集信息来进行学习。

还有一些其他的训练方法:

· 小样本学习(Few-shot Learning)

· 长尾学习(Long-tailed Learning,对于分类任务中某些类别的数据量特别少可使用该算法)

· 零样本学习(Zero-shot Learning)

· 终身学习(Life-long Learning,模型部署之后也一直根据新数据学习)

· 生成对抗学习(Generative Adversarial Learning,两个模型对抗着互相学习)

· 迁移学习(Transfer Learning,一种抽象概念,把某一个空间学习的内容迁移到另一个空间去)

· 元学习(Meta Learning,让模型学习如何学习,如自动选择函数、自动调参等)

· 联邦学习(Federated Learning,集合多台机器的力量把训练结果汇集在一起)

· 深度学习(Deep Learning,使用很多层神经网络进行学习)。


博客评论
还没有人评论,赶紧抢个沙发~
发表评论
说明:请文明发言,共建和谐网络,您的个人信息不会被公开显示。