一文读懂：AI 界的“判断大师”——逻辑回归算法

发表于 2026-04-16 分类于机器学习基础

摘要：逻辑回归（Logistic Regression）是机器学习中最经典的分类算法。本文从线性回归的局限性出发，深入解析 Sigmoid 函数的作用机制、对数损失函数的原理及其在工业界的广泛应用。

1. 为什么不能直接用线性回归做分类？

线性回归擅长预测连续数值，但在面对“非黑即白”的分类问题（如垃圾邮件检测、肿瘤良恶性判断）时，它会遇到两个致命问题：

为了解决这个问题，我们需要一种方法，将线性回归的无限输出“压缩”到 0 和 1 之间。

💡 核心概念：
逻辑回归：一种广义的线性模型，虽然名字带有“回归”，但主要用于解决二分类问题。

逻辑回归的核心在于引入了 Sigmoid 函数（也称 S 型函数）。

$$y = \frac{1}{1 + e^{-z}}$$

这个函数的形状像一个平滑的”S”。它的特性是：无论输入的 $z$ 是多大的正数或负数，输出结果永远被严格限制在 $(0, 1)$ 区间内。

逻辑回归的运作可以看作“线性回归 + Sigmoid 外衣”：

计算特征的线性组合：$z = w_1x_1 + … + w_nx_n + b$。

将 $z$ 输入 Sigmoid 函数，得到概率 $P$。例如 $P=0.85$ 表示模型认为该样本属于正类（如恶性肿瘤）的概率是 85%。

设定阈值（通常为 0.5）。若 $P \ge 0.5$ 则判定为 1，否则为 0。

在逻辑回归中，均方误差（MSE）不再适用，因为加上 Sigmoid 函数后，损失曲面会变得非凸，难以优化。因此，逻辑回归采用对数损失函数（Log Loss / Cross-Entropy Loss）。

其核心逻辑是“惩罚盲目自信的错误”：

从预测数值的线性回归，到预测概率的逻辑回归，这是理解机器学习决策过程的关键一步。尽管深度学习模型日益强大，但逻辑回归凭借其出色的效率与可解释性，依然是现代互联网架构中不可或缺的基石。

如果你觉得这篇文章有帮助，欢迎分享给需要的朋友。