机器学习概论

机器学习 2023-09-03 15:59 107 0

网课推荐

· 吴恩达（Andrew Ng）

· 主页，机器学习教程，深度学习教程

· 李宏毅（Hung-Yi Lee）

· 主页，机器学习教程

人工智能 vs. 机器学习

· 人工智能（Artificial Intelligence）与机器学习（Machine Learning）没有严格的定义。

· 人工智能包含了机器学习。

· 一般来说，人类让某个事物拥有智能，该事物就是AI，一般我们都指的是机器。

· 一般来说，只要一个机器能自我学习，那就是机器学习。

机器学习的本质

· 机器学习的本质是寻找一个函数（Looking for a function）。

· 如果要做股票预测，就需要找到一个函数，输入是历史股票数据，输出是预测未来的股票数据；如果要做图像识别，输入就是一张图，输出就是这张图对应的分类。

机器学习的框架

· 对于要完成某一个任务，要选择一类合适的函数，不同的任务要选择不同的函数。这是一个经验之谈，需要有一定的经验才能选择适合的函数。

· 在选择了函数之后，还需要在该种类的函数中，选择最好的那一个。如下图中，很明显f1的识别效果要比f2好得多，因此肯定不选f2。

· 在机器学习中，我们用模型（Model）代指函数。

· 机器学习中，数据是很重要的，用于给模型进行学习的数据被称为训练数据（Training Data），训练数据包含两部分，分别是输入部分（如下图中的图片）和输出部分（如下图中的标签，即正确答案）。

· 接下来，我们需要评估一个模型（函数）的好坏（Goodness of function F），我们会规定一个损失函数（Loss Function），使用这个函数，我们可以评估每一个函数（f1、f2...fn）的好坏，从而让我们能选出一个最好的函数。

· 最后，我们需要优化算法（Optimization），因为我们想加快搜索的速度（如减少搜索空间），但这不是必须的。

· 总结一下，机器学习的框架如下：先找到一些训练数据，然后选择一类合适的模型，然后对这类模型进行一个个的评估，找到最好（较好）的一个，最后测试。

· 上述经典框架其实在现在只适用于监督学习（Supervised Learning），现在还有很多变种，如零样本学习（Zero-shot Learning），就不需要准备数据集。

机器学习的分类

· 监督学习（Supervised Learning），如回归（Regression）与分类（Classification）。

· 无监督学习（Unsupervised Learning），如聚类（Clustering）与降维（Dimensionality reduction）。

· 集成学习（Ensemble Learning），即用多个模型来实现一个需求。

· 强化学习（Reinforcement Learning），即从环境中收集信息来进行学习。

还有一些其他的训练方法：

· 小样本学习（Few-shot Learning）

· 长尾学习（Long-tailed Learning，对于分类任务中某些类别的数据量特别少可使用该算法）

· 零样本学习（Zero-shot Learning）

· 终身学习（Life-long Learning，模型部署之后也一直根据新数据学习）

· 生成对抗学习（Generative Adversarial Learning，两个模型对抗着互相学习）

· 迁移学习（Transfer Learning，一种抽象概念，把某一个空间学习的内容迁移到另一个空间去）

· 元学习（Meta Learning，让模型学习如何学习，如自动选择函数、自动调参等）

· 联邦学习（Federated Learning，集合多台机器的力量把训练结果汇集在一起）

· 深度学习（Deep Learning，使用很多层神经网络进行学习）。

Chapter 7 —— 运输层（3）

Makefile中的变量

博客评论

还没有人评论，赶紧抢个沙发~

发表评论

说明：请文明发言，共建和谐网络，您的个人信息不会被公开显示。

分类

C++ （12）

Linux基础（29）

版本控制Git （2）

Makefile （7）

机器学习（16）

数字图像处理（8）

数据库系统原理（10）

高性能计算（2）

计算机网络（12）

算法之美（1）