当前位置: 首页>> 蚁坊指数 >>正文
机器学习算法实践-线性回归
2020-02-26 10:56:00 作者:蚁坊软件研究院 浏览次数:305 标签: 深度学习算法

前面我们介绍了多种机器学习算法,但它们都是用来分类的,今天我们讲一下另一种类型,回归。回归是基于已有数据建立回归模型,对新的数据进行预测。今天要讲的是线性回归模型。

0线性回归模型主要学习内容

1)一元线性回归模型

2)多元线性回归模型

3)损失函数

4)正则化

1 一元线性回归

一元线性方程反映一个因变量与一个自变量之间的线性关系。即:

那一元线性回归模型呢?则为:

为了便于理解,下面举例说明:

例:有一个公司,十个月的广告费用和销售额,如下表所示:

我们都知道广告费与销售额存在相关性,但具体是怎么的呢?

先将广告费和销售额画在二维坐标内,得到一个散点图,发现两者成直线上升的趋势,可利用一元线性回归来拟合这一条直线:

那具体怎么拟合的呢?如何确定拟合直线的效果好呢?

1.1线性回归的损失函数:平方误差

对于一元线性回归来说,可以看成Y的值随着X的值变化,每个实际的X都会有一个实际的Y值,,我们拟合一条直线,则每个实际的X都会有个直线预测Y值,我们要使每个真实的Y值与对应预测的Y值之差的平方和最小,即损失函数为:


2多元线性回归

上一节讲的是一元线性回归,只要一个自变量x对因变量y作回归,那要是有两个或两个以上的自变量呢?这就是我们接下来要讲的多元线性回归,模型形式为:

矩阵表示:

K-1个解释变量的多元线性回归模型的n次观测数据,可表示为

我们知道,对于多元线性回归中的最小化问题一般使用多元微积分求解,其原理与一元线性回归方程的最小二乘法相同,得到一个参数已求出的多元线性方程。

3 正则化

为防止模型的过拟合,我们在建立线性模型的时候经常需要加入正则化项,一般有L1正则化和L2正则化。

线性回归的L1正则化,通常称为Lasso回归:

Lasso回归可以使得一些特征的系数变小,甚至一些绝对值较小的系数值直接变为0。增强模型的泛化能力。

线性回归的L2正则化,通常称为Ridge回归:

Ridge回归在不抛弃任何一个特征的情况下,缩小了回归系数,使得模型相对而言比较的稳定,但和Lasso回归比,这会使得模型的特征留的特别多,模型解释性差。

4 线性回归总结

总的来说,线性回归模型就是用于分析变量之间的关系、以及变量是如何影响结果的一种方法。建立模型之后,可根据新变量预测其结果。

4.1 线性回归的优点

1. 建模速度快,不需要很复杂的计算,在数据量大的情况下依然运行速度很快。

2. 回归分析可以准确地计量各个因素之间的相关程度与回归拟合程度的高低,提高预测方程式的效果,可以根据系数给出每个变量的理解和解释。

4.2 线性回归缺点

1. 对异常值很敏感

2. 假定条件较多,并且选用何种因子和该因子采用何种表达式只是一种推测,这影响了因子的多样性和不可测性,使得回归分析受到限制。

5 线性回归的应用

1)广告费与销售额的关系

2)中国人口自然增长分析的应用

3)家庭用电预测

4)分析豆瓣评分与票房之间的关系

参考文献

[1] https://baike.so.com/doc/6956818-7179250.html

[2] https://blog.csdn.net/pql925/article/details/80084673

[3] https://www.cnblogs.com/pinard/p/6004041.html

[4]https://wenku.baidu.com/view/0f706dff68dc5022aaea998fcc22bcd126ff4288.html?rec_flag=default&sxts=1565236766219

[5] https://blog.csdn.net/Katherine_hsr/article/details/79942260

[6] https://blog.csdn.net/loveliuzz/article/details/78608897


(部分文字、图片来自网络,如涉及侵权,请及时与我们联系,我们会在第一时间删除或处理侵权内容。电话:4006770986  邮箱:zhangming [at]eefung.com  负责人:张明)

热门文章
文章推荐
舆情监测关注问题换一换
标签云 换一换
舆情监测软件排名 抗疫英雄事迹舆情 虚假新闻 什么是舆情 舆情传播 舆情分析研判 互联网舆情 网络舆情网 如何网络舆情 2020年舆情报告 2020年舆情 社交媒体舆情 疫情舆情 医院舆情 舆论风险防范 热点监测 舆论监测软件 深度学习算法 机器学习 网络在线教学舆情 抗击疫情 疫情舆情分析 舆论分析 舆情公关 财经金融舆情监测 舆情事件 舆情案例 舆情系统 虐童事件 免费舆情监测软件 反转新闻 免费大数据平台有哪些 在线舆情监测 舆情监测哪家好 舆情监测方法 舆情监测报价 做好舆情监控 网红 微舆情 微博传播分析 舆情监测工具 传播路径分析 网红直播 舆情预警系统 近期舆情 手机舆情监测 全网舆情监测 新浪舆情 舆情搜索 网络热点事件 新华舆情 2019网络热词 网络流行语 在线监测软件 大数据分析工具 百度舆情监测 舆情监控前几大公司 数据分析软件有哪些 企业危机管理 315 网络舆情危机 网络舆情监测公司 中国食品药品安全舆情事件案例 社交新全媒体监测系统工具平台公司 网信办信息汇总 危机公关 政府舆情 舆情监测预警 舆情监测解决方案 互联网舆情监控系统 网络舆论监测 网络舆情分析系统 互联网舆情分析 舆情是什么意思 德云社 网络舆论分析 大数据舆情监测案例 互联网舆情监测平台 政府舆情监测系统 互联网舆情监测系统哪家好 网络社会热点舆情分析系统 舆情信息收集 假期舆情 媒体监测 数据监测 谣言传播 新闻舆情 舆情查询 舆情预警 网络热词 地方舆情 社会事件舆情分析 微博数据分析 地震舆情 民生舆情 舆情风险监测 高考舆情 政府舆情监测 舆情监测方案 舆情案例分析 网红舆情 舆情监测公司 2019舆情热点 舆情监测软件 舆情监测 社会舆论热点 犯罪舆情 科技舆情 股票舆情 月度舆情分析 消防舆情 舆情信息分析 航空舆情 微信舆情监测 民航舆情 舆情数据分析 消费舆情 环境舆情 人物舆情 公益舆情 食品舆情 新媒体舆情 新媒体舆情监测 感动中国 学校舆情 舆情监测平台 大数据舆情 大数据舆情分析 影视舆情 舆论监督 2019舆情 网络舆情监测 2018舆情事件盘点 2018舆情报告 舆情监测服务商 免费舆情监测系统 舆情报告 负面舆情 舆情分析 舆情研判 舆论监测 校园舆情 舆情热点事件 公共事件舆情 雾霾舆情 蚁坊软件 高校舆情 港澳台舆情 媒体舆情 涉军舆情 涉法舆情 拆迁舆情 网络舆情 舆情反转 旅游舆情 反腐舆情 海外舆情 信息惠民 灾害舆情 应急管理 智慧城市 体育舆情 景区舆情 媒体舆论 娱乐舆情 检察舆情 舆情管理 政务舆情 税务舆情 强拆舆情 司法舆情 舆情研究 交通舆情 企业舆情 法院舆情 舆情指数 政策舆情 舆情汇总 会议舆情 医疗舆情 环保舆情 涉警舆情 明星舆情 社会舆情 教育舆情