跳转至

机器学习中的数学

1. 最小二乘法

一、概念

最小二乘法是一种数学优化技术,通过最小化误差的平方和来寻找数据的最佳函数匹配。

二、原理
  1. 假设模型:设数据满足线性关系 \(y = ax + b\),其中 \(a\)\(b\) 为待求参数。
  2. 残差平方和:定义残差平方和 \(S(a,b) = \sum_{i=1}^n (y_i - (ax_i + b))^2\)
  3. 最小化目标:寻找使 \(S(a,b)\) 最小的 \(a\)\(b\)
三、推导过程
  1. 求偏导数:对 \(a\)\(b\) 求偏导数并令其等于零。
    • \(\frac{\partial S}{\partial a} = -2 \sum_{i=1}^n x_i(y_i - (ax_i + b)) = 0\)
    • \(\frac{\partial S}{\partial b} = -2 \sum_{i=1}^n (y_i - (ax_i + b)) = 0\)
  2. 解方程组:得到关于 \(a\)\(b\) 的方程组。
    • \(a = \frac{n\sum x_i y_i - \sum x_i \sum y_i}{n\sum x_i^2 - (\sum x_i)^2}\)
    • \(b = \frac{\sum y_i - a\sum x_i}{n}\)
四、步骤
  1. 收集数据:获取观测数据点 \((x_i, y_i)\)
  2. 计算参数:利用上述公式计算 \(a\)\(b\)
  3. 拟合直线:绘制直线 \(y = ax + b\),观察拟合效果。
五、示例
  1. 数据集:
    • $x = $
    • $y = $
  2. 计算参数:
    • \(\sum x_i = 15\)\(\sum y_i = 20\)
    • \(\sum x_i y_i = 66\)\(\sum x_i^2 = 55\)
    • \(a = \frac{5 \times 66 - 15 \times 20}{5 \times 55 - 15^2} = 0.6\)
    • \(b = \frac{20 - 0.6 \times 15}{5} = 1.4\)
  3. 拟合直线:\(y = 0.6x + 1.4\)

2. 全概率公式

全概率公式是概率论中用于计算复杂事件概率的重要工具。它通过将复杂事件分解为若干互斥且完备的简单事件,分别计算各简单事件的概率及其对复杂事件的影响,再求和得到最终结果。

公式表达

设事件\(B_1, B_2, \ldots, B_n\)构成样本空间的一个划分(即互斥且并集为全集),且\(P(B_i) > 0\),则对任意事件\(A\),有:

\[ P(A) = \sum_{i=1}^{n} P(B_i) \cdot P(A|B_i) \]

其中:

  • \(P(B_i)\):事件\(B_i\)发生的概率。
  • \(P(A|B_i)\):在\(B_i\)发生的条件下,事件\(A\)发生的概率。

关键概念

  • 样本空间的划分:将样本空间划分为互斥且完备的事件组,确保所有可能性都被覆盖。
  • 先验概率:\(P(B_i)\)表示在考虑条件前的初始概率。
  • 条件概率:\(P(A|B_i)\)表示在特定条件下事件\(A\)的概率。

应用步骤

  1. 确定划分:找出导致事件\(A\)发生的所有互斥且完备的原因(\(B_1, B_2, \ldots, B_n\))。
  2. 计算先验概率:计算每个原因\(B_i\)发生的概率\(P(B_i)\)
  3. 计算条件概率:确定在每个原因\(B_i\)下,事件\(A\)发生的概率\(P(A|B_i)\)
  4. 应用公式:将各\(P(B_i)\)\(P(A|B_i)\)相乘并求和,得到\(P(A)\)

示例

问题:某工厂的零件由甲、乙两车间生产,甲车间生产60%,合格率95%;乙车间生产40%,合格率90%。求随机抽取一件零件为合格品的概率。

解答:

  • \(B_1\)为“甲车间生产”,\(B_2\)为“乙车间生产”,\(A\)为“合格品”。
  • \(P(B_1) = 0.6\)\(P(B_2) = 0.4\)
  • \(P(A|B_1) = 0.95\)\(P(A|B_2) = 0.90\)
  • 应用全概率公式:
\[ P(A) = 0.6 \times 0.95 + 0.4 \times 0.90 = 0.57 + 0.36 = 0.93 \]

结论:随机抽取零件为合格品的概率为93%。