source: https://www.bilibili.com/video/BV1dKfyBAENQ
机器学习就是喂给计算机一堆数据,让计算机自己学习,然后根据学习到的知识(模型、函数权重参数)对新的数据进行预测.
- 人工智能
- 核心方法: 符号、机器、深度学习
- 学习方式: 监督学习、无监督学习、半监督学习、强化学习
- 回归: 线性回归、非线性回归
- 分类: KNN、决策树、逻辑回归、多项式回归
- 聚类: K-means、mean shift
- 其它技术: 异常检测、PCA
- 多层感知器MLP
- 卷积神经网络CNN, MLP+Cov
- 循环神经网络RNN, MLP+Recycle
- 深度学习框架Keras
- 监督+无监督的混合算法
- 迁移学习
- 数据加载及展示
- 数据预处理
- 模型选择与训练
- 模型预测与解释
- 模型评估与优化
- 定义: 用于预测连续数值的监督学习算法
- 公式:
- 损失函数: 均方误差MSE
- 搜索方法: 梯度下降
- 定义: 用于预测二分类问题的监督学习算法
- 公式: sigmoid函数
- 损失函数: 交叉熵损失
- 搜索方法: 梯度下降
- 单个样本的分段形式, 最小化损失函数:
- 定义: 无监督学习算法, 用于将数据集中的样本分组, 使得同一组内的样本相似度较高, 而不同组内的样本相似度较低
- kmeans、mean shift 聚类算法
- 定义: 用于分类和回归的监督学习算法, 它通过一系列的决策规则将数据分为不同的类别或预测连续数值
- 定义: 无监督学习算法, 用于识别数据集中与正常样本显著不同的异常样本
-
定义: 用于减少数据维度的技术, 它可以帮助我们可视化高维数据, 同时保留数据的重要特征. 主要目标: 寻找k(k < n)维新数据,使得新数据能反映事物的主要特征.
-
PCA主成分分析
其中,
- 定义: 连续的概率分布函数(PDF,正态分布), 用于描述随机变量服从高斯分布的情况
- 公式:
其中,
数据质量决定模型表现的上限!
- 数据属性的意义, 是否为无关数据
- 不同属性数据的数量级差异
- 是否有异常数据
- 采集到的数据是否有代表性
- 统一标注标准
欠拟合、过拟合问题
- 欠拟合: 模型简单, 无法捕捉数据的复杂模式
- 过拟合: 模型复杂, 记忆了训练数据的噪声, 导致在新数据上表现不佳
- 定义: 多层感知器MLP, 它由多个神经元层组成, 每个神经元层都与下一层神经元层全连接
- 公式:
其中,
- 定义: 卷积神经网络CNN, 它由多个卷积层和池化层组成, 用于处理图像数据
- 公式:
其中,
先提取出图像中的关键信息(轮廓、特征点等), 再建立mlp模型进行训练. 经典的CNN模型有LeNet-5、AlexNet、VGG16等
- 定义: 循环神经网络RNN, 它由多个循环层和输出层组成, 用于处理序列数据
- 公式:
其中,
- 定义: 长短期记忆网络LSTM, 它由多个LSTM单元组成, 用于处理序列数据
- 公式:
其中,
定义: 它利用在一个任务上学到的知识, 来解决另一个相关任务. 主要目标: 减少新任务的训练数据量, 同时提高模型的泛化能力. 例如:
- 从图像分类任务中学到的特征, 可以用于物体检测任务
- 从语音识别任务中学到的特征, 可以用于语音合成任务
定义: 它通过与环境的交互, 学习如何在给定状态下采取最优动作, 以最大化累积奖励. 主要目标: 找到一个策略, 使得智能体在环境中获得最大的奖励. 例如:
- 游戏中的智能体, 学习如何玩游戏, 以最大化得分
- 机器人中的智能体, 学习如何在环境中移动, 以完成任务