搜索:虚拟机

BGP多线

转载 2018-08-29 00:34 阅读(175)次
我们在购买虚拟主机、云主机和VPS主机等主机产品时,都会涉及到线路选择,而在线路选择中,我们经常会看到其中有BGP机房。那么,BGP机房是什么意思呢?在它的优势又是什么呢? 首先说一说国内存在的南北线路互通的问题。这个问题从国内电信和网通分开之后开始出现的,由于北方大部分使用的是网通线路,而南方使用的是电信的线路,如果网站服务器是电信线路,那么北方网民访问会非常慢,同理,南方的网站北方网民访问也很慢。为了解决这个问题,IDC服务商采用很多技术手段来解决这一问题,其中就包括BGP技术。 那什么是BGP技术? BGP(BGP(边界网关协议)主要用于互联网AS(自治系统)之间的互联,BGP的最主要功...
BGP

常见但不要滥用的优化器学习结果的方式

原创 2018-05-10 11:50 阅读(114)次
机器学习的结果就是预测函数,或者叫做model(mahout里面是称之为model)。 当我们使用这个预测函数,不论是回归还是分类或者聚类,我们把新的数据传入到预测函数,多少还是需要人工判断一下预测结果的准确度的。当发现结果不理想的时候,一般可以从以下几个方面考虑。 首先,在极少的情况下,你可以把这个预测函数可视化,也就是画图展示出来。这有个苛刻的条件,你的特征项不能超过3个,否则3维以上的图形是很难画出来的。如果你有幸特征项是在3个以下,请尝试画出函数图,看看是否过拟合训练数据。 抛弃理想情况,更多的我们是要观察一下机器学习算法的训练数据是否合适。 首先看看训练样本数量是否足够,特别是多分...

监督学习的数据集的划分和模型的选择

原创 2018-05-09 17:41 阅读(141)次
对于监督学习中的训练样本数据,划分技巧是很重要的。 往往我们的划分是七三分,70%训练集,30%测试集。 但这并不是最好的。 因为不管是回归还是分类问题,在多次项 polynomial 的选择上有很多。在讨论过拟合问题中我们提到过,高次项过多是过拟合的一种表征,而都是1次项组成又容易发生欠拟合。 多次项如何选择呢。就需要数据集的划分出验证集来做验证。 数据集首先应该打乱顺序,因为一些数据可能存在递增递减,或者按时间段起伏的特点,如果在划分数据的时候是按顺序划分,很可能让每份数据差别很大。所以需要随机并按比例分。 其次数据集应该分为三分,60%训练集,20%验证集,20%测试集。 为什么会多出了...

正则化-解决过拟合

原创 2018-04-07 16:20 阅读(133)次
过拟合的问题我已经介绍过了: 过拟合 我们知道过拟合的表征就是预测函数有太多高阶项比如3次方,4次方,或者更高。那我们可以通过降低或者去除这些项来解决过拟合问题,正则化的本质是为了简化预测函数的模型,使函数曲线更平滑,而减少这些高次项带来的过拟合。 由于h(x)是一个以x为自变量的函数,我们无法控制输入的数据x,所以简化函数的手段就是去减少或者去除某些参数θk。 去除高次项需要一些正确人工判断,人工就存在主观,可能带来错误,把一些对正确预测结果有帮助的特征项(但可能帮助很小,但却被扩大而造成过拟合)去掉。此时减少这些被扩大的影响比去除掉此特征项更合适。 在做预测函数h(x)求参数θ解...

多分类问题的求解思路

原创 2018-03-19 18:21 阅读(123)次
在 机器学习之分类入门 一文中,我们介绍过分类问题中有多分类的问题,在之前的介绍中,我们更多的都是在寻找二分类的问题的决策边界。在二维坐标系中,二分类的决策边界是一条直线,3D坐标系,决策边界是一个平面。 而多分类问题,假设类别有1,2,3,4   四种分类,四种分类的样本分布在二维坐标系中,此时是无法只用一条线把多种分类划分出来。但我们换位思考,我们把这些样本看成类别1和其他类别(包含了类别2,3,4) -----  两种分类,那就可以用一条线把类别1,和其他类别-1划分出来。同理,我们把样本看成类别2和其他类别(包含了类别1,3,4),那我...

器学习之回归入门

原创 2018-03-03 18:18 阅读(121)次
什么是回归问题转换成数学问题线性回归什么是回归问题        预测明天甚至未来一周的气温,这是回归问题。 预测 iphone的价格走势,这是回归问题 预测房价的走势,这是回归的问题。 甚至位于数学界最深渊的问题,预测股价,也是回归问题 从上面这4个问题我们能发现回归问题预测的是连续的结果(这是相对于分类的离散值而言),是一个具体的数值。 这就是机器学习的回归问题。 同时他也是监督学习的一种。 监督学习:首先他需要由一定数量的训练数据集,数据集中包含训练需要的特征项,同时也包含正确的"答案"。   ...

分类之逻辑回归的代价函数costfunction梯度下降求解

原创 2018-02-25 17:14 阅读(147)次
我们在 分类之  分类之逻辑回归的代价函数costfunction  此文中已经给出了cost function, 现在我们要求解。 依然是用梯度下降法来求解,找到cost function  的最小值    minJ(θ)。 因为minJ(θ) 就是说明预测和真实值最接近,预测函数得出的错误“代价”最小。        梯度下降法就是重复做下面的计算 而后半部分求导得到         ...

器学习之分类入门

原创 2018-02-14 16:37 阅读(160)次
分类问题    数学问题    线性回归不适用    目标    什么是分类问题       判断一个水果,他是苹果,梨子,葡萄,还是桔子。这就是分类问题。       判断一个人是否可以得到贷款,这也是分类问题。       判断一颗植物是否还能存活,这同样是分类问题。       判断一个水果还过多久才能成熟,这就...

初识docker

原创 2018-02-13 16:40 阅读(141)次
需求    功能    和虚拟机的区别    镜像    容器   docker到底是什么需求       随着云计算的发展,现在越来越少公司是自己采购服务器或者租用IDC的固定服务器机架的方式来部署应用了。阿里云,腾讯云,金山云,Amazon,google, 微软等云服务提供商已经大量使用虚拟化计算来提供云服务       想想云服务还没兴起的那几年,也是笔者入行的时候,开发...

安全访问内网linux的方式之XShell的隧道(tunneling)

原创 2018-02-10 16:16 阅读(190)次
前言    需求      解决方案     前言       SSH  :   Secure Shell,一种安全协议,分为ssh1,ssh2两个不同的版本    (这里不是J2EE的那三大框架)。       XShell支持ssh1,ssh2等协议,是目前比较常用的安全终端软件,不过是付费的。       你可以...