机器学习
机器学习(Machine Learning)就是让计算机通过数据学习规律,而不是通过硬编码的指令来执行任务
模型
模型是由算法和数据构成,类似于一个函数y=f(x),把已知条件送给模型,模型给出预测的结果
模型工作的核心流程
输入数据
在训练之前,我们给模型输入大量的训练数据,模型会尝试寻找输入与标签之间的数学关系。例如:
| 输入数据 | 标签 |
|---|---|
| 输入 | 输出 |
| 房子大小 | 房价 |
| 历史天气 | 明天天气 |
| 用户浏览记录 | 会不会点击广告 |
| 邮件内容 | 是不是垃圾邮件 |
训练数据:我们送给模型的数据,包含输入还有标签(正确的输出结果)
推理
模型会在这个阶段进行计算,例如:
y = w*x + b
- x: 输入
- w, b: 模型的参数(模型需要进行调整)
- y: 预测
模型在学习阶段通过我们给的输入以及标签,进行调整自己的 w 和 b 数值。 模型通过学习找到了”规律”,就可以处理没有见过的数据了
训练
-
准备的数据:
学习时间 x(小时) 成绩 y(分) 1 50 2 60 3 70 4 80 -
一开始模型的参数是随机的,模型拿到我们的数据后,计算出来的输出也是随机的,模型会计算输出结果与标签之间的差距是多少,例如:
y = 10x + 20- 真实成绩 = 70
- 模型预测 = 50
error = 真实成绩 - 模型预测 = 10计算损失值的过程称为损失函数(Loss)
-
模型根据损失函数来调整自己的参数(也就是自己的 w 和 b 数值)
y = 11.5x + 22.4这个调整自己参数的过程叫做梯度下降(Gradient Descent)
-
多次循环步骤1~步骤3,模型会得到一个最终的调整结果
y = 10x + 40
机器学习的三种主要类型
根据学习方式的不同,通常将模型分为三类:
| 类型 | 特点 | 场景 |
|---|---|---|
| 监督学习 (Supervised) | 有“标准答案”,模型不断向答案靠拢。 | 垃圾邮件识别、房价预测 |
| 无监督学习 (Unsupervised) | 没有答案,模型自己找数据的相似性。 | 用户画像分组、异常检测 |
| 强化学习 (Reinforcement) | 通过环境反馈不断试错,在追求奖励中进化。 | 自动驾驶、下围棋 (AlphaGo) |