跳转至

算法面试大集

机器学习中的数学

机器学习中的数学¶

1. 最小二乘法¶

一、概念¶

最小二乘法是一种数学优化技术，通过最小化误差的平方和来寻找数据的最佳函数匹配。

二、原理¶

假设模型：设数据满足线性关系 \(y = ax + b\)，其中 \(a\) 和 \(b\) 为待求参数。
残差平方和：定义残差平方和 \(S(a,b) = \sum_{i=1}^n (y_i - (ax_i + b))^2\)。
最小化目标：寻找使 \(S(a,b)\) 最小的 \(a\) 和 \(b\)。

三、推导过程¶

求偏导数：对 \(a\) 和 \(b\) 求偏导数并令其等于零。
- \(\frac{\partial S}{\partial a} = -2 \sum_{i=1}^n x_i(y_i - (ax_i + b)) = 0\)
- \(\frac{\partial S}{\partial b} = -2 \sum_{i=1}^n (y_i - (ax_i + b)) = 0\)
解方程组：得到关于 \(a\) 和 \(b\) 的方程组。
- \(a = \frac{n\sum x_i y_i - \sum x_i \sum y_i}{n\sum x_i^2 - (\sum x_i)^2}\)
- \(b = \frac{\sum y_i - a\sum x_i}{n}\)

四、步骤¶

收集数据：获取观测数据点 \((x_i, y_i)\)。
计算参数：利用上述公式计算 \(a\) 和 \(b\)。
拟合直线：绘制直线 \(y = ax + b\)，观察拟合效果。

五、示例¶

数据集：
- $x = $
- $y = $
计算参数：
- \(\sum x_i = 15\)，\(\sum y_i = 20\)
- \(\sum x_i y_i = 66\)，\(\sum x_i^2 = 55\)
- \(a = \frac{5 \times 66 - 15 \times 20}{5 \times 55 - 15^2} = 0.6\)
- \(b = \frac{20 - 0.6 \times 15}{5} = 1.4\)
拟合直线：\(y = 0.6x + 1.4\)

2. 全概率公式¶

全概率公式是概率论中用于计算复杂事件概率的重要工具。它通过将复杂事件分解为若干互斥且完备的简单事件，分别计算各简单事件的概率及其对复杂事件的影响，再求和得到最终结果。

公式表达¶

设事件\(B_1, B_2, \ldots, B_n\)构成样本空间的一个划分（即互斥且并集为全集），且\(P(B_i) > 0\)，则对任意事件\(A\)，有：

\[ P(A) = \sum_{i=1}^{n} P(B_i) \cdot P(A|B_i) \]

其中：

\(P(B_i)\)：事件\(B_i\)发生的概率。
\(P(A|B_i)\)：在\(B_i\)发生的条件下，事件\(A\)发生的概率。

关键概念¶

样本空间的划分：将样本空间划分为互斥且完备的事件组，确保所有可能性都被覆盖。
先验概率：\(P(B_i)\)表示在考虑条件前的初始概率。
条件概率：\(P(A|B_i)\)表示在特定条件下事件\(A\)的概率。

应用步骤¶

确定划分：找出导致事件\(A\)发生的所有互斥且完备的原因（\(B_1, B_2, \ldots, B_n\)）。
计算先验概率：计算每个原因\(B_i\)发生的概率\(P(B_i)\)。
计算条件概率：确定在每个原因\(B_i\)下，事件\(A\)发生的概率\(P(A|B_i)\)。
应用公式：将各\(P(B_i)\)与\(P(A|B_i)\)相乘并求和，得到\(P(A)\)。

示例¶

问题：某工厂的零件由甲、乙两车间生产，甲车间生产60%，合格率95%；乙车间生产40%，合格率90%。求随机抽取一件零件为合格品的概率。

解答：

设\(B_1\)为“甲车间生产”，\(B_2\)为“乙车间生产”，\(A\)为“合格品”。
\(P(B_1) = 0.6\)，\(P(B_2) = 0.4\)。
\(P(A|B_1) = 0.95\)，\(P(A|B_2) = 0.90\)。
应用全概率公式：

\[ P(A) = 0.6 \times 0.95 + 0.4 \times 0.90 = 0.57 + 0.36 = 0.93 \]

结论：随机抽取零件为合格品的概率为93%。