公司新闻

如何在分类算法中使用逻辑回归

日期:2022-06-12 09:12:49 作者:乐鱼在线 来源:乐鱼体育安卓版下载 阅读:10

  是一种监督学习算法,尽管它包含“回归”这个词,但主要用于解决二元“分类”任务。“回归”与“分类”相矛盾,但逻辑回归的重点其实是在“逻辑”这个词,它指的是逻辑函数,在算法中实际上用于完成分类任务。

  逻辑回归是一种简单而有效的分类算法,因此常用于二元分类任务。客户流失、垃圾邮件、网站或广告点击预测是逻辑回归提供有效解决方案的示例,甚至用作神经网络层的激活函数。

  逻辑回归的基础是逻辑函数,也称为S型函数(Sigmoid Function),取实数值并将其映射至 0 到 1 之间的值。

  逻辑回归模型以线性方程为输入值,使用逻辑函数和对数几率,执行二元分类任务。在详细介绍逻辑回归之前,我们先回顾一下概率(Probability)范围内的一些概念。

  概率(Probability)衡量事件发生的可能性。例如,我们说“垃圾邮件的概率为90%”:

  以上概念,本质上都代表相同的衡量标准,但采取的方式不同。如果采用逻辑回归,我们就会使用对数几率(Log Odds)。这也就是在逻辑回归算法中首选对数几率的原因。

  概率为0.5,意味着垃圾邮件与非垃圾邮件的可能性相同。这里可以注意一下,概率为 0.5 的对数几率是 0。我们会用到这一点。

  假设 y 是正类的概率。如果 z 为 0,则 y 为 0.5。对于 z 的正值,y 大于 0.5,对于 z 的负值,y 小于 0.5。如果正类的概率大于 0.5(即概率大于50%),我们可以将结果预测为正类 (1)。反之结果为负类 (0)。

  下表是一些z值及其对应的y(概率)值。所有实数都映射在 0 和 1 之间。

  这看起来就像是在解决线性回归问题。在训练阶段,我们用极大似然估计法(maximum-likelihood estimation algorithm)确定函数参数。然后,对于给定的自变量(x1, … xn)值,我们就可以得出正类的概率。

  我们可以直接使用计算的概率结果。例如,输出值可以是垃圾邮件的概率为 95%,或者客户点击此广告的概率为 70%。但是,在大多数情况下,概率会被用于对数据点进行分类。比如,如果概率大于 50%,则预测为正类 (1)。否则,预测为负类 (0)。而且,我们只是将线性回归问题的解决方案转换为二元分类任务。

  逻辑回归是一种简单却有效的算法,用于解决二元分类问题。逻辑函数(即 S型函数)也经常作为输出层的激活函数,用于复杂的神经网络中。

乐鱼在线
乐鱼在线 @ 版權歸所有 乐鱼在线