机器学习算法分类

First Post:

Last Update:

算法分为:

  1. 监督学习
  • 定义:输入数据是由输入特征值和目标值所组成
    • 函数的输出可以是连续的值(回归)
    • 或是输出有限个离散值(分类)
  1. 无监督学习
  • 定义:输入数据是由输入特征值组成,没有目标值
    • 输入数据没有被标记,也没有确定的结果。样本数据类别未知
    • 需要根据样本间的相似性对样本集进行类别划分
  1. 半监督学习
  • 定义训练集同时包含有标记样本数据和未标记样本数据
  1. 强化学习
    1
    2
    3
    4
    5
    6
    7
    8
    9
    	In	Out	目的	案例
    监督学习
    (supervised learning) 有标签 有反馈 预测结果 猫狗分类 房价预测
    无监督学习
    (unsupervised learning) 无标签 无反馈 发现潜在结构 “物以类聚,人以群分”
    半监督学习
    (Semi-Supervised Learning) 部分 有标签, 部分无标签 有反馈 降低数据标记的难度
    强化学习
    (reinforcement learning) 决策流程及激励系统 一系列行动 长期利益最大化 学下棋

工作流

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
1.获取数据

2.数据基本处理
- 1.缩小数据集范围DataFrame.query()
- 2.选取有用的时间特征
- 3.将签到位置少于n个用户的删除

3.特征工程
- 特征提取
- 特征预处理
- 特征降维
- 特征预处理(标准化)

4.机器学习(模型训练)

5.模型评估
- 结果达到要求,上线服务
- 没有达到要求,重新上面步骤