搜索:机器学习

BGP多线

转载 2018-08-29 00:34 阅读(175)次
我们在购买虚拟主机、云主机和VPS主机等主机产品时,都会涉及到线路选择,而在线路选择中,我们经常会看到其中有BGP机房。那么,BGP机房是什么意思呢?在它的优势又是什么呢? 首先说一说国内存在的南北线路互通的问题。这个问题从国内电信和网通分开之后开始出现的,由于北方大部分使用的是网通线路,而南方使用的是电信的线路,如果网站服务器是电信线路,那么北方网民访问会非常慢,同理,南方的网站北方网民访问也很慢。为了解决这个问题,IDC服务商采用很多技术手段来解决这一问题,其中就包括BGP技术。 那什么是BGP技术? BGP(BGP(边界网关协议)主要用于互联网AS(自治系统)之间的互联,BGP的最主要功...
BGP

(转自CSDN)深度学习入门必须理解这25个概念

转载 2018-06-06 21:34 阅读(111)次
最近在一个公众号看到推送了这篇文章,写得还是通俗易懂的,如果有基础的小伙伴看起来应该很不错,我觉得用来复习巩固知识非常合适 我联系博主,还没回复,容我转载过来自己时常复习。如有不妥,请联系我删除。 原文地址:https://blog.csdn.net/pangjiuzala/article/details/72630166    作者 Star先生神经网络基础1)神经元(Neuron)——就像形成我们大脑基本元素的神经元一样,神经元形成神经网络的基本结构。想象一下,当我们得到新信息时我们该怎么做。当我们获取信息时,我们一般会处理它,然后生成一个输出。类似地,在神经网络的情况...

常见但不要滥用的优化机器学习结果的方式

原创 2018-05-10 11:50 阅读(114)次
机器学习的结果就是预测函数,或者叫做model(mahout里面是称之为model)。 当我们使用这个预测函数,不论是回归还是分类或者聚类,我们把新的数据传入到预测函数,多少还是需要人工判断一下预测结果的准确度的。当发现结果不理想的时候,一般可以从以下几个方面考虑。 首先,在极少的情况下,你可以把这个预测函数可视化,也就是画图展示出来。这有个苛刻的条件,你的特征项不能超过3个,否则3维以上的图形是很难画出来的。如果你有幸特征项是在3个以下,请尝试画出函数图,看看是否过拟合训练数据。 抛弃理想情况,更多的我们是要观察一下机器学习算法的训练数据是否合适。 首先看看训练样本数量是否足够,特别是多分...

监督学习的数据集的划分和模型的选择

原创 2018-05-09 17:41 阅读(141)次
对于监督学习中的训练样本数据,划分技巧是很重要的。 往往我们的划分是七三分,70%训练集,30%测试集。 但这并不是最好的。 因为不管是回归还是分类问题,在多次项 polynomial 的选择上有很多。在讨论过拟合问题中我们提到过,高次项过多是过拟合的一种表征,而都是1次项组成又容易发生欠拟合。 多次项如何选择呢。就需要数据集的划分出验证集来做验证。 数据集首先应该打乱顺序,因为一些数据可能存在递增递减,或者按时间段起伏的特点,如果在划分数据的时候是按顺序划分,很可能让每份数据差别很大。所以需要随机并按比例分。 其次数据集应该分为三分,60%训练集,20%验证集,20%测试集。 为什么会多出了...

概率的那些“差”

原创 2018-04-21 11:47 阅读(109)次
平均数,一般用字母μ表示 算数平均数 ,mean,表达的都是同一种意思,一般是指 不过还有加权平均数,即每项都有不同权重值。即 标准差,一般用字母σ表示   方差,variance  为总体方差,  为变量,  为总体均值,  为总体例数。

正则化-解决过拟合

原创 2018-04-07 16:20 阅读(133)次
过拟合的问题我已经介绍过了: 过拟合 我们知道过拟合的表征就是预测函数有太多高阶项比如3次方,4次方,或者更高。那我们可以通过降低或者去除这些项来解决过拟合问题,正则化的本质是为了简化预测函数的模型,使函数曲线更平滑,而减少这些高次项带来的过拟合。 由于h(x)是一个以x为自变量的函数,我们无法控制输入的数据x,所以简化函数的手段就是去减少或者去除某些参数θk。 去除高次项需要一些正确人工判断,人工就存在主观,可能带来错误,把一些对正确预测结果有帮助的特征项(但可能帮助很小,但却被扩大而造成过拟合)去掉。此时减少这些被扩大的影响比去除掉此特征项更合适。 在做预测函数h(x)求参数θ解...

-极大似然估计

转载 2018-04-02 00:30 阅读(109)次
这是一个基于概率的算法。 转自百度百科的原理  极大似然估计 它是建立在极大似然原理的基础上的一个统计方法,极大似然原理的直观想法是,一个随机试验如有若干个可能的结果A,B,C,... ,若在一次试验中,结果A出现了,那么可以认为实验条件对A的出现有利,也即出现的概率P(A)较大。极大似然原理的直观想法我们用下面例子说明。设甲箱中有99个白球,1个黑球;乙箱中有1个白球.99个黑球。现随机取出一箱,再从抽取的一箱中随机取出一球,结果是黑球,这一黑球从乙箱抽取的概率比从甲箱抽取的概率大得多,这时我们自然更多地相信这个黑球是取自乙箱的。一般说来,事件A发生的概率与某一未知参数&...

-最小二乘法

转载 2018-03-23 16:54 阅读(111)次
我这里转载知乎上 司马懿 的回答,我个人认为通俗易懂,写得非常好。原文地址在 知乎-最大似然估计和最小二乘法怎么理解?的回答 设想一个例子,教育程度和工资之间的关系。我们观察到的数据无非就是一个教育程度,对应着一个工资。我们希望的自然是找到两者之间的规律:如果把教育程度的初中、高中、大学、研究生及博士定义为1234的话,我们希望找到类似于工资=1000 +2000x教育程度  的这种规律,其中1000和2000是我们需要从数据里面发现的,前者称之为底薪,后者称之为教育增量薪水。 如果我们就观察到两个数据,那解起来很简单,直接把两个数据带进去,二元一次方程组,就得到底薪和教育...

-arg

原创 2018-03-23 16:24 阅读(97)次
公式中常见到 arg min()  或者 arg max() 他们的含义是 argument of the maximum/minimum。 即 arg max f(x): 当f(x)取最大值时,x的取值集合 arg min f(x):当f(x)取最小值时,x的取值集合 如:    f(x)  = 1 - |x|   .         arg max f(x)  就是 {0} ,  因为当x = 0 的时候, 1-|x| = 1 是f(x)的极限。 如果...

-范数

转载 2018-03-22 17:43 阅读(131)次
范数分为   向量范数和矩阵范数。范数,是具有“长度”概念的函数。 参考:https://blog.csdn.net/zouxy09/article/details/24971995   https://blog.csdn.net/jack_20/article/details/72896459   https://www.zhihu.com/question/20473040          引用了其中很多学习到的内容 向量范数:  对N维度的空间中任意一个向量X,按照一定的法...

-线性,非线性

转载 2018-03-22 17:12 阅读(116)次
在机器学习中,经常讨论线性和非线性,这是一个入门级扫盲,我记录下来完全是自己查阅。 我查看了不同的一些网上说法,选择这个解释 转载自:  https://zhidao.baidu.com/question/94379061.html 线性linear,指量与量之间按比例、成直线的关系,在空间和时间上代表规则和光滑的运动; 非线性non-linear则指不按比例、不成直线的关系,代表不规则的运动和突变。 线性:指量与量之间按比例、成直线的关系,在数学上可以理解为一阶导数为常数的函数; 非线性:则指不按比例、不成直线的关系,一阶导数不为常数。 线性关系:两个变量之间存在一次方函...

概念- 矩阵特征值,特征向量

原创 2018-03-22 17:00 阅读(118)次
笔者深入地学习机器学习后,发现多年前的数学已经都还给了老师。还有一些是没有学习过的知识。 这里我打算我需要重新确认的数学知识记录下来。 但我能力有限,很多是转载,在这里先感谢那些在网上编写这些数学知识的达人。 矩阵特征值和特征向量我反正是还给老师了,重新学习后,感觉还是需要一些生动的比拟来解释。 这些是我结合知乎和CSDN上的内容的整合。 定义: 设A是n阶矩阵,如果数λ和n维非零向量x使关系式    成立,那么,这样的数λ称为矩阵A的特征值,非零向量v称为A的对应于特征值λ的特征向量。 首先得先弄清矩阵的概念:一个矩阵代表的是一个线性变换规则,而一个矩阵的乘法运行代表...

多分类问题的求解思路

原创 2018-03-19 18:21 阅读(123)次
在 机器学习之分类入门 一文中,我们介绍过分类问题中有多分类的问题,在之前的介绍中,我们更多的都是在寻找二分类的问题的决策边界。在二维坐标系中,二分类的决策边界是一条直线,3D坐标系,决策边界是一个平面。 而多分类问题,假设类别有1,2,3,4   四种分类,四种分类的样本分布在二维坐标系中,此时是无法只用一条线把多种分类划分出来。但我们换位思考,我们把这些样本看成类别1和其他类别(包含了类别2,3,4) -----  两种分类,那就可以用一条线把类别1,和其他类别-1划分出来。同理,我们把样本看成类别2和其他类别(包含了类别1,3,4),那我...

机器学习之回归入门

原创 2018-03-03 18:18 阅读(121)次
什么是回归问题转换成数学问题线性回归什么是回归问题        预测明天甚至未来一周的气温,这是回归问题。 预测 iphone的价格走势,这是回归问题 预测房价的走势,这是回归的问题。 甚至位于数学界最深渊的问题,预测股价,也是回归问题 从上面这4个问题我们能发现回归问题预测的是连续的结果(这是相对于分类的离散值而言),是一个具体的数值。 这就是机器学习的回归问题。 同时他也是监督学习的一种。 监督学习:首先他需要由一定数量的训练数据集,数据集中包含训练需要的特征项,同时也包含正确的"答案"。   ...

分类之逻辑回归的代价函数costfunction梯度下降求解

原创 2018-02-25 17:14 阅读(147)次
我们在 分类之  分类之逻辑回归的代价函数costfunction  此文中已经给出了cost function, 现在我们要求解。 依然是用梯度下降法来求解,找到cost function  的最小值    minJ(θ)。 因为minJ(θ) 就是说明预测和真实值最接近,预测函数得出的错误“代价”最小。        梯度下降法就是重复做下面的计算 而后半部分求导得到         ...

octave之算数Arithmetic

原创 2018-02-23 14:24 阅读(174)次
数学的遗忘是我学习机器学习中最烦恼的事情了。我不知道有多少程序员跟我一样把数学大部分都已经还给老师了。但要学好机器学习甚至是深度学习,数学得捡回来。Exponents and Logarithms 指数和对数Trigonometry 三角函数其他Exponents and Logarithms 指数和对数e 约等于2.718这件事情没忘吧。exp (x)计算以自然对数e为底的指数计算exp(3) ans = 20.086log (x)以e为底求对数log(2.71) ans = 0.99695log1p (x)相当于log(x+1) ,貌似没什么用的方法。...

机器学习之分类入门

原创 2018-02-14 16:37 阅读(160)次
分类问题    数学问题    线性回归不适用    目标    什么是分类问题       判断一个水果,他是苹果,梨子,葡萄,还是桔子。这就是分类问题。       判断一个人是否可以得到贷款,这也是分类问题。       判断一颗植物是否还能存活,这同样是分类问题。       判断一个水果还过多久才能成熟,这就...

初识docker

原创 2018-02-13 16:40 阅读(141)次
需求    功能    和虚拟机的区别    镜像    容器   docker到底是什么需求       随着云计算的发展,现在越来越少公司是自己采购服务器或者租用IDC的固定服务器机架的方式来部署应用了。阿里云,腾讯云,金山云,Amazon,google, 微软等云服务提供商已经大量使用虚拟化计算来提供云服务       想想云服务还没兴起的那几年,也是笔者入行的时候,开发...

安全访问内网linux的方式之XShell的隧道(tunneling)

原创 2018-02-10 16:16 阅读(190)次
前言    需求      解决方案     前言       SSH  :   Secure Shell,一种安全协议,分为ssh1,ssh2两个不同的版本    (这里不是J2EE的那三大框架)。       XShell支持ssh1,ssh2等协议,是目前比较常用的安全终端软件,不过是付费的。       你可以...