逻辑回归

一、什么是逻辑回归

逻辑回归的原理是用逻辑函数把线性回归的结果(-∞,∞)映射到(0,1)

线性回归函数

线性回归函数的数学表达式：

其中xi是自变量，y是因变量，y的值域为(-∞,∞)，θ0是常数项，θi(i=1,2,...,n)是待求系数，不同的权重θi反映了自变量对因变量不同的贡献程度。

我们初中学过的一元一次方程：y=a+bx，这种只包括一个自变量和一个因变量的回归分析称为一元线性回归分析。

初中学过的二元一次方程：y = a+b1x1+b2x2，三元一次方程：y = a+b1x1+b2x2+b3x3，这种回归分析中包括两个或两个以上自变量的回归分析，称为多元线性回归分析。

不管是一元线性回归分析还是多元线性回归分析，都是线性回归分析。

逻辑函数(Sigmoid函数)

二、如何求解逻辑回归中的参数

极大似然函数

先来看一个小例子：如果小华这次考试考了90分以上，妈妈99%会奖励小华一个手机，如果没有考到90分以上，妈妈99%不会奖励小华手机。现在小华没有得到手机，问小华这次有没有考到90分。

可能我们的第一反应是小华大概率没有考到90分以上。这种利用已知样本结果，反推最有可能导致这样结果的参数值，就是极大似然估计。

结合逻辑回归函数，如果我们已经积累了大量的违约客户和正常客户的样本数据，利用极大似然函数由果溯因，估计出使得目前结果的可能性最大参数(系数)θ，有了参数我们就可以求任何一个客户违约的概率了。

我们上文提到过客户违约的后验概率

相应的可以得到客户不违约的概率：

如果令

违约的后验概率可以写成：

不违约的后验概率可以写成：

对于某一个客户，我们采集到了样本数据(x,y)。对于这个样本，他的标签是y的概率可以定义成：

其中y∈{0,1}。当y=0时，上式为不违约的后验概率，当y=1时，上式为违约的后验概率。

现在我们有m个客户的观测样本

将每一个样本发生的概率相乘，就是这个合成在一起得到的合事件发生的总概率(利用概率中的乘法公式)，即为似然函数，可以写成：

其中θ为待求参数。

注：我们总是希望出现目前结果的可能性最大，所以想要得到极大化似然函数对应的参数θ。

为便于求解，我们引入不改变函数单调性的对数函数ln，把连乘变成加法，得到对数似然函数：

至此，可以用梯度上升法求解对数似然函数，求出使得目前结果的可能性最大的参数θ。也可以由对数似然函数构造损失函数，用梯度下降法求出使得损失最小对应的参数θ，接下来看下逻辑回归中的损失函数。

注：使用对数似然函数，不仅仅把连乘变成加法，便于求解，而且对数似然函对应的损失函数是关于未知参数的高阶连续可导的凸函数，便于求其全局最优解。

构造损失函数

在机器学习中有损失函数的概念，我们知道损失函数一般定义为预测值和真实值的差，比如我们预测小华在这次考试中能考98分，成绩出来了小华实际考了97分，小华的成绩预测值和真实值差为1，这个1通俗理解就是损失函数的值。

从上面的案例知，如果损失函数越小，说明模型预测越准。所以在函数比较复杂没有确定解(解析解)或很难求出确定解的情况下，一般求的是数值解(近似解)。一般模型求数值解可以求出使得损失函数最小对应的参数θ。

结合逻辑回归中的极大似然函数，如果取整个数据集上的平均对数似然损失，我们可以得到:

其中J(θ)为损失函数，由对数似然函数前面添加负号取平均得到。

即在逻辑回归模型中，最大化似然函数和最小化损失函数实际上是等价的(求最大化对数似然函数对应的参数θ和求最小化平均对数似然损失对应的参数θ是一致的)，即：

那如何求得损失函数最小对应的参数呢？可以用下节讲到的方法：梯度下降法。

用梯度下降法求解参数

先以一个人下山为例讲解梯度下降法的步骤：

step1：明确自己现在所处的位置；
step2：找到现在所处位置下降最快的方向；
step3: 沿着第二步找到的方向走一个步长，到达新的位置，且新位置低于刚才的位置；
step4：判断是否下山，如果还没有到最低点继续步骤一，如果已经到最低点，则停止。

从上面的分析知，用梯度下降法求解参数最重要的是找到下降最快的方向和确定要走的步长。

那么什么是函数下降最快的方向？

如果学过一元函数的导数，应该知道导数的几何意义是某点切线的斜率。除此之外导数还可以表示函数在该点的变化率，导数越大，表示函数在该点的变化越大。

可以发现p2点的斜率大于p1点的斜率，即p2点的导数大于p1点的导数。

对于多维向量

它的导数叫做梯度(偏导数)，当求某个变量的导数时，把其它变量视为常量，对整个函数求导，也就是分别对于它的每个分量求导数，即

对于函数的某个特定点，它的梯度就表示从该点出发，函数值变化最为迅猛的方向。至此梯度下降法求解参数的方向已经找到，那就是函数的梯度方向。

接下来推导损失函数的梯度(偏导数)：

由损失函数的公式知：

对损失函数求偏导：

损失函数 J(θ)中，是 θ和 x 都是一个向量形式，也就是：

当我们仅仅针对θ进行求导的时候：

可以看到上面需要利用sigmoid函数的求导方法：

至此，LR的损失函数的求导形式已经结束，这里面主要用到了sigmoid函数的求导，推导起来其实是比较简单的。最后写出梯度下降的更新公式：

展开阅读全文

页面更新：2024-04-27

标签：求出求导导数梯度对数线性概率函数逻辑损失参数

1 2 3 4 5

特斯拉开闸放水，丧心病狂的马斯克要用15万的车撬动整个地球

特斯拉丧心病狂的宏图计划特斯拉宏伟蓝图计划特斯拉计划推出搭载53度磷酸铁锂的紧凑车型，目标销量4200万台。马斯克人有多大胆，车有多大产，给他一辆车，他想撬动整个地球。4200万销量目标属于天方夜谭，但毫无疑问特斯拉开闸

3.99万元起售，极限续航200km，详解未奥BOMA

新能源汽车的发展在近些年的表现可以说是势不可挡了，究其原因，除了当前全球节能减排的号召之外，那就是新能源汽车较低的用车成本了，毕竟相比于燃油车而言，用电显然成本更低，对环境的污染也更低。正是在这种趋势之下，新能源汽

车展来了｜充电10分钟续航400公里！造车新势力亮点一览-

我国新能源汽车产销连续8年保持第一，市场渗透率超过30%，在电动化转型中占领先机。以“拥抱汽车行业新时代”为主题的2023第二十届上海国际汽车工业展览会正在上海举行，传统汽车巨头绝地反击，新能源品牌乘势而上，全球车企都

三山五岳台前客，定胜佳木闲池阁-魅族 20(转自酷安)

#畅聊数码新品#三山五岳台前客，定胜佳木闲池阁——魅族 20阿彭炸薯片“青浅白沙，依山观海愿藉这方晴空下的银滩，脱离世俗繁杂，憩谈生舌，细述心声。”是一种生活方式，是一种处事态度，也是魅族 20 未公布之前魅族官方的一条动

2.7秒加速，800公里续航，售价约合150万！Lucid Air实拍

如果说美国的造车新势力公司，你只记得特斯拉。那你就太孤陋寡闻了。在美国Lucid也是一家非常知名的造车新势力公司。他是由特斯拉前高管创办，公司内也有很多来自特斯拉的员工，因此Lucid Air也被看成是特斯拉model S的最

构建一个基于NodeJS的影院服务并使用Docker进行部署（2）

书接上回如何构建一个NodeJS影院微服务，并使用Docker进行部署在本文中,我们将继续开发我们的电影微服务,这次我们将开发电影目录服务来完成如下的设计图：电影服务流程总览我们将会用到如下几个技术：NodeJS version 7.2.

蔚来汽车李斌:价值成就品牌，全新ES6不打价格战

日前，蔚来汽车在上海车展上召开了品牌发布会。发布会上，蔚来发布了全新家用纯电动中型SUV蔚来ES6。新车沿袭了蔚来家族的基因，较老款在车辆使用细节方面更加地贴合用户实际体验。ES6推出后，蔚来基于NT2.0平台的车型数量

纯电续航可上400公里，元Pro起售价9.88万元，值得选吗

在汽车市场进入新能源时代之后，比亚迪汽车一跃而上，成为最受国内消费者青睐的汽车品牌之一，旗下很多车型都得到消费者青睐。不过正如燃油车时代，BBA旗下也有不受消费者青睐的车型一般，比亚迪旗下也有车型的销量成绩比较惨

全品牌电动化阵营齐发力，奔驰为豪华加“电”

四款重磅纯电动车型集结亮相，覆盖梅赛德斯-奔驰旗下所有的高端豪华品牌及产品线，如此火力全开的电动化攻势，点燃了整个上海车展的电动化热浪。这四款让人颇为惊喜的纯电动车型分别是：全球首发的全新梅赛德斯-迈巴赫EQS纯

深度试驾-雷克萨斯RZ ，一款豪华、运动、环保的新能源汽车

汽车，不仅是一种交通工具，更是一种生活方式。随着科技的不断进步，汽车的品质和性能也日益提高。而今天我要为大家介绍的这款雷克萨斯RZ 2023款 450e DIRECT4 纵行版，则完美地融合了豪华、运动和环保三大元素，究竟它有何绝

大众ID.3，优惠2.3万，第一年平均每个月养护费用约602元

新能源紧凑型车因为售价和尺寸空间较适中，同时能耗不高，所以成为了许多家庭用车的首选级别。有车友表示对大众ID.3 2022款纯净智享版比较感兴趣，想了解该车的养护成本。该车的车身尺寸长宽高为4261x1778x1568mm，车身结构

隐私计算赛道受资本青睐翼方健数获数亿元B++轮融资

新民晚报讯（记者张钰芸）数字经济已经成为带动中国经济增长的核心动力之一。业界预测，2025年我国数字经济规模将超过60万亿元，占GDP比重将逐步提升到40%-50%，成为我国经济发展的一条主线。而隐私计算是保护数据流通的隐私

2000万消费券27日12点开抢！龙华区又发券了

01领券时间2023年龙华区“悦享食宿在龙华”促消费活动第一轮消费券将于4月27日中午12点开抢！02领券范围此次促消费活动聚焦餐饮、住宿领域，通过美团平台发放消费券。其中，酒店消费券全国消费者均可领取，餐饮消费券仅限当

“创区域品牌，铸精品农业” 昆明举办区域品牌建设专题培训和质量服务专场活动

来源：【云南日报】4月25日，以“创区域品牌，铸精品农业”为主题的昆明市区域品牌建设专题培训和质量服务专场活动，在昆明市知识产权保护中心开展。昆明市市场监督管理局(市知识产权局)知识产权发展促进处副处长李骥、云南

省直公积金“商转公”进件可线上办理

湖南日报4月26日讯（全媒体记者刘奕楠）一季度，湖南省直单位住房公积金管理中心（以下简称“中心”）共计发放贷款2910笔、金额17.46亿元，其中“商转公”贷款1318笔、金额7.51亿元，同比分别增长162.55%、209.77%。面对“爆火”

上滑加载更多 ↓

逻辑回归

一、什么是逻辑回归

二、如何求解逻辑回归中的参数

特斯拉开闸放水，丧心病狂的马斯克要用15万的车撬动整个地球

3.99万元起售，极限续航200km，详解未奥BOMA

车展来了｜充电10分钟续航400公里！造车新势力亮点一览-

三山五岳台前客，定胜佳木闲池阁-魅族 20(转自酷安)

2.7秒加速，800公里续航，售价约合150万！Lucid Air实拍

构建一个基于NodeJS的影院服务并使用Docker进行部署（2）

蔚来汽车李斌:价值成就品牌，全新ES6不打价格战

纯电续航可上400公里，元Pro起售价9.88万元，值得选吗

全品牌电动化阵营齐发力，奔驰为豪华加“电”

深度试驾-雷克萨斯RZ ，一款豪华、运动、环保的新能源汽车

大众ID.3，优惠2.3万，第一年平均每个月养护费用约602元

隐私计算赛道受资本青睐翼方健数获数亿元B++轮融资

2000万消费券27日12点开抢！龙华区又发券了

“创区域品牌，铸精品农业” 昆明举办区域品牌建设专题培训和质量服务专场活动

省直公积金“商转公”进件可线上办理

“户口合并”或于五月份启动？3件事尽早办，错过或会损失

线性代数精华-矩阵的特征值与特征向量

14胜0负！湖人晋级概率高达95.2%！提前恭喜湖人，打进西部半

伦纳德大概率赛季报销了！心疼威少！没有乔治没有伦纳德！

损失超1000亿？欧盟、中国相继出手，苹果Lightning接口或

盘点失去大合同又失去工作的6位NBA球星，考辛斯损失2.47

美媒预测10位有望进入名人堂的球员：4人100%，哈登威少概

Python魔法函数（和）

研究发现：喜马拉雅冰川的冰湖将引起质量损失的30%以上

客官楼上请！深圳工业上楼底层逻辑和趋势分享会27日举行