请选择 进入手机版 | 继续访问电脑版
搜索
房产
装修
汽车
婚嫁
健康
理财
旅游
美食
跳蚤
二手房
租房
招聘
二手车
教育
茶座
我要买房
买东西
装修家居
交友
职场
生活
网购
亲子
情感
龙城车友
找美食
谈婚论嫁
美女
兴趣
八卦
宠物
手机

分类算法之逻辑回归(Logistic Regression

[复制链接]
查看: 49|回复: 0

1万

主题

2万

帖子

4万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
46383
发表于 2019-11-9 09:50 | 显示全部楼层 |阅读模式
分类算法之逻辑回归(Logistic Regression)

1.二分类题目

现在有一家医院,想要对病人的病情举行分析,其中有一项就是关于良性\恶性肿瘤的判定,现在有一批数据集是关于肿瘤巨细的,使命就是按照肿瘤的巨细来判定是良性还是恶性。这就是一个很典型的二分类题目,即输出的成果只要两个值----良性和恶性(凡是用数字0和1表现)。如图1所示,我们可以做一个直观的判定肿瘤巨细大于5,即为恶心肿瘤(输出为1);小于即是5,即为良性肿瘤(输出为0)。
分类算法之逻辑回归(Logistic Regression  游戏 006y8mN6ly1g8qnuikr53j30fq0auwer

2.分类题目标本质

分类题目本质上属于有监视进修,给定一个已知分类的数据集,然后经过分类算法来让盘算机对数据集举行进修,这样盘算机便可以对数据举行猜测。以肿瘤的例子来说,已稀有据集如图1所示,现在要对一个病人的病情举行诊断,那末盘算机只必要将该病人的肿瘤巨细和5举行比力,然后便可以揣度出是恶性还是良性。分类题目和回归题目有必定的类似性,都是经过对数据集的进修来对未知成果举行猜测,区分在于输出值不同。回归题目标输出值是持续值(例如屋子的价格),分类题目标输出值是离散值(例如恶性大要良性)。既然分类题目和回归题目有必定的类似性,那末我们能不能在回归的根柢上举行分类呢?答案是可以的。一种可行的思绪是,先用线性拟合,然后对线性拟合的猜测成果值举行量化,行将持续值量化为离散值。
3.分类题目标假定函数

分类题目固然和回归题目有必定的类似,可是我们并不能间接操纵回归题目中的假定函数作为分类题目标假定函数。还是以图1的例子为例,假如我们采取一元线性函数(即\(h(x) = \theta_0+\theta_1x\))去举行拟合的话,成果大如果这样子的:$h_\theta(x) = \dfrac{5}{33}x-\frac{1}{3} $,表现在图片中就是:
分类算法之逻辑回归(Logistic Regression  游戏 006y8mN6ly1g8qp47ozn6j30fy0azgm6

这样,你大要会做这样的一个判定:对于这个线性拟合的假定函数,给定一个肿瘤的巨细,只要将其带入假定函数,并将其输出值和0.5举行比力,假如大于0.5,就输出1;小于0.5,就输出0。在图1的数据会合,这类方式确切可以。可是假如将数据集变动一下,如图3所示,此时线性拟合的成果就会有所不同:
分类算法之逻辑回归(Logistic Regression  游戏 006y8mN6ly1g8qqef8wzkj30g70ayt99

假如采取类似的方式,那末就会把巨细为6的情况举行误判为精巧。所以,我们不能纯真地经过将线性拟合的输出值与某一个阈值举行比力这类方式来举行量化。对于逻辑回归,我们的量化函数为Sigmoid函数(也称Logistic函数,S函数)。其数学表达式为:\(S(x) = \dfrac{1}{1+e^{-x}}\) ,其图像如图4:
分类算法之逻辑回归(Logistic Regression  游戏 006y8mN6ly1g8qquqty7lj30fz0aldg2

可以看到S函数的输出值就是0和1,在逻辑回归中,我们采取S函数来对线性拟合的输出值举行量化,所以逻辑回归的假定函数为:
\[h_\theta(x)=\dfrac{1}{1+e^{-\theta^Tx}}=\dfrac{1}{1+e^{-\sum_{i=0}^n\theta_ix_i}} \tag{3.1}\]

其中,\(x\)为增广特征向量(1*(n+1)维),\(\theta\)为增广权向量(1*(n+1)维)。这个假定函数所表现的数学寄义是:对于特定的样本\(x\)与参数矩阵\(\theta\),分类为1的几率(假定y只要0和1两类),也就即\(h_\theta(x) = P(y=1|x;\theta)\)。按照其数学意义,我们可以这样以为:假如\(h_\theta(x)>0.5\),则判定y = 1;假如\(h_\theta(x)

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright © 2006-2014 妈妈网-中国妈妈第一,是怀孕、育儿、健康等知识交流传播首选平台 版权所有 法律顾问:高律师 客服电话:0791-88289918
技术支持:迪恩网络科技公司  Powered by Discuz! X3.2
快速回复 返回顶部 返回列表