吴恩达机器学习笔记1

一、关于回归方程的直观印象

  我们有一批关于'房屋面积'和'房子价格'的数据,如图1-1:

                【图 1-1】

  从图右边中可以很直观地看出,大致上,随着房屋面积的增加,房屋的售价也在提高,也就是它俩之间有'某种关系'。

  而后,我们想,要是我有一套房子,面积是x平方,那应该标价多少钱才合适呢?

  于是我们就在现有的数据中,找出面积与售价之间的关系,该关系以数学语言表达就是一条线性回归方程(h(x)=kx+b,y为价格,x为面积),面积为自变量,售价为因变量。

  最后将我们手上这套房子的面积代入到方程中,就可以计算出应该标价多少钱。

                【图 1-2】

  如图1-2右边橙色的线,便是我们通过计算得出的回归方程所绘制的线,再回代房子面积所得出的预测价格,它很'直'。

  尽管线性回归方程不是百分之百符合现实数据,但是它使得一些看起来杂乱的数据更加可量化、计算以及利用,回归方程是一种'折中'。

二、方程误差

  由图1-2右边可以看出,我们的预测价格与实际价格是有误差的,每处的误差为(预测价格-实际价格),所有误差加起来便是总误差,求总误差的方程便称为代价函数(或 损失函数、成本函数、loss function),以J(k,b)表示。

  其中每处的误差为(预测价格-实际价格),用符号表示便是 h(xi) - yi  (h(x)为回归方程所计算的预测价格,xi,yi表示第i个数据);

  总误差便为∑(h(xi) - yi),但这样做有一个问题,误差有负有正,它们会相互抵消,因此我们为每处误差加上平方,即 ∑(h(xi) - yi2,其中为了方便后续计算,我们将其写成J(k,b)=1/2m·∑(h(xi) - yi2

  当我们想用回归方程去预测房子价格时,当然希望误差最小,即求出代价函数的最小值。

三、最小误差

  在数学中如何计算最小值?

  答:求导->求驻点、断点、不可导点->通过比较

  但是实际生活的数据中往往很复杂,可能找到驻点很困难、可能数据量大或没有边界(端点)......所以我们只能采取近似的方法去求的最小值。

  求最小值的方法是,选择一个起点,一步一步地去探索最小值,最终收敛。

  在代价函数J(k,b)中,xi ,yi  都是已知数据,唯有h(x)中的k,b未知,求最小值实质就是求'合适'的k,b,使得该代价函数最小。

  求'合适'的k,b的公式,k0=0,b0=0为初始值:

    

  其中:a为学习率,即每次要迈多大的步子去探索,a值太大(容易扯着蛋)容易'跨’过最小值;太小,则探索时间长。

  为什么要对k,b分别求偏导呢?我们以二维的图像来阐明。设代价函数为J(θ)

            【图3-1】

  图3-1中,图中红色切点便是初始值,求导所得的便是切线的斜率,由图可见该绿色切线斜率为正数。

  于是 θ = θ - a*一个正数,此时θ变小了点,红点往下移,更加靠近图像最低点(代价函数最小值);

  不断重复该过程,切线将趋于平缓,斜率趋于0,函数最小值便收敛了,此过程称之为梯度下降。

            【图3-2】

四、补充,关于导数的本质

  导数是什么?

  导数是变化率,导数是切线斜率,导数是速度........

  以一元函数而言,导数其实是: 当x变化一点点,y会变化了多少,这个“多少”便是导数。

(0)

相关推荐

  • 重庆市巴蜀中学高2021届第六次月考:导数与函数的公切线

    重庆·云师堂 大寒,节气轮回. 不出意外,这将是农历庚子年的最后一夜,洗净身心,以待来年惊喜.一切终章,皆是过往,快意易尽,来日方长. 定云止水,有鸢飞鱼跃之景象:风狂雨骤,有波恬浪静之风光. 除了数 ...

  • 第11招:借点搭桥-公切线问题

    第11招:借点搭桥 - 公切线问题 某点处切线的几何意义是该点处切线的斜率,一般情况下我们经常研究一条曲线和一条(或多条)切线.现在我们提出问题:多条曲线能否共一条切线? 定义:同时和曲线 . 都相切 ...

  • 吴恩达机器学习笔记2

    一.逻辑回归(Logistics 回归)直观印象 逻辑回归是用来解决分类问题,比如给定一个肿瘤的直径大小(x),要预测出它是良性(0)还是恶性(1),如图1-1. [图1-1] 如图中我们可以直观地看 ...

  • 下载量过百万的吴恩达机器学习和深度学习笔记.PDF

    吴恩达机器学习和深度学习课程笔记都更新了,本文提供下载,这两本笔记非常适合机器学习和深度学习入门. 0.导语 黄海广博士和同学将吴恩达老师机器学习和深度学习视频课程做了完整的笔记,笔记pdf放在git ...

  • CV开发者自我修养 | 吴恩达教程/笔记/刷题资料最全汇总

    加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动! 同时提供每月大咖直播分享.真实项目需求对接.干货资讯汇总 ...

  • 吴恩达:机器学习应以数据为中心

    今天是吴恩达45岁生日.他是国际最权威的ML学者之一,学生遍布世界各地.在最近的一期线上课程中,吴恩达提出了以模型为中心向以数据为中心的AI. 吴恩达发推称,「大家为自己送上最好的礼物就是,观看这个视 ...

  • 吴恩达的机器学习教程真的很赞

    这几天公众号都没更新,因为最近长沙一直在降雪,天冷了人也会变的懒的.好久没有玩自己的大疆,今天给大家看看雪后中南大学的雪景,这是大邓拍摄,我师兄kimmko剪的. 前天在哔哩哔哩上看到有全套的吴恩达的 ...

  • 吴恩达《Machine Learning》精炼笔记 10:异常检测

    在本文中主要讲解了机器学习中的异常检测问题,主要包含: 问题产生 高斯分布 算法使用场景 八种无监督异常检测技术 异常检测和监督学习对比 特征选择 异常检测Novelty Detection 异常是相 ...

  • 机器学习研究者的养成指南,吴恩达建议这么读论文

    机器之心整理 机器之心编辑部 如何成为一名高效的机器学习研究者,然后在这个领域取得一些成就?在此之前,我们需要养成什么样的习惯?近日,一篇发布在 Reddit 机器学习版块的帖子引发了众人的讨论. 近 ...

  • 吴恩达《Machine Learning》精炼笔记 7:支持向量机 SVM

    今天带来第七周课程的笔记:关于支持向量机SVM的相关知识点.内容包含: 硬间隔 支持向量 软间隔 对偶问题 优化目标Optimization Objectives 主要是讲解如何从逻辑回归慢慢的推导出 ...

  • 视频教程 | 机器学习:吴恩达主讲

    EEWORLD 电子资讯 犀利解读 技术干货 每日更新 今天向大家推荐一门深受世界各地机器学习入门者喜爱的视频教程,由人工智能专家吴恩达主讲的<MachineLearning>(机器学习) ...