撰写于:  浏览:1195 次  分类:机器学习电子书
解决非线性问题的另种技术是添加相似特征。这些特征经过相似函数计算得出,相似函数可以测量每个实例与一个特定地标之间的相似度。以前面提到过的一维数据集为例,在x=-2和x=1处添加两个地标。接下来,我们采用高斯径向基函数(RBF) 作为相似函数,y=0.3 高斯RBF这是一个从0 (离地标差得非常远)到1 (跟地标-样)变化的钟形函数。现在我们准备计算[...]

撰写于:  浏览:1165 次  分类:机器学习电子书
处理非线性数据集的方法之是添加更多特征, 比如多项式特征,某些情况下,这可能导致数据集变得线性可分离。下图是一个简单的数据集,只有一个特征x,可以看出,数据集线性不可分,但是如果添加第二个特征x2=(x1)2,生成的2D数据集则完全线性可分离。 一个简单的方法就是将每个特征的幕次方添加为一个新特征,然后在这个拓展过的特征集上训练线性模型。一般情况下[...]

撰写于:  浏览:1194 次  分类:机器学习电子书
处理缺失值主要有以下几种方法:(1)当某个变量的缺失值占比过大时,那么我们可以认为这一变量没有意义,可以直接删除。(2)缺失值可以用平均值、中值、分位数、众数、随机值等替代,但是效果一般,因为等于人为增加了噪声。(3)用其他变量做预测模型来算出缺失变量,效果比方法2略好,但有一个根本缺陷,如果其他变量和缺失变量无关,则预测的结果无意义。如果预测结果[...]

撰写于:  浏览:1117 次  分类:机器学习电子书
1、什么是特征?特征通常是建立在原始数据之上的特定表示,通常用数据集中的列表示。对于一个通用的二维数据集,每个观测值由一行表示,每个特征由一列表示,对于每一个观测具有一个特定的值。2、特征工程是什么?当你想要自己的预测模型性能达到最佳时,你要做的不仅是要选取最好的算法,还要尽可能的从原始数据中获取更多的信息。这就是特征工程要做的事,它的目的就是获取[...]

撰写于:  浏览:1108 次  分类:机器学习电子书
模型,就是函数,模型通常分为下面三类:(1)线性模型(2)核模型(3)层次模型

撰写于:  浏览:1206 次  分类:机器学习电子书
1、什么是模型呢?简单的说,模型就是函数,就是数学公式。2、什么是拟合呢?经常看到一些复杂的公式,结构对称,身段优美,是某个天才晚上做梦想出来的吗?看下面这个公式:显然不太可能。那么它是怎么来的呢?我猜测:先画出来的,然后测算若干个x和y的关系,最后试出来的公式。这是一个根据数据不断猜和尝试的过程。上述的过程,就是拟合的过程。拟合,指的是对一些数据[...]

撰写于:  浏览:1396 次  分类:默认分类
备注:本文修订于2020年6月21日。1、windows环境变量的认识在windows安装程序要明白三点:(1)程序安装在哪里并不重要,最重要的是系统变量指向具体的安装路径,这样就能启动程序。(2)同一个程序可以安装多次,存放在不同的路径,通过修改环境变量的“指路标”,就能实现启动不同的程序,而这些程序也不会相互冲突。(3)也许你的系统已经安装了P[...]

撰写于:  浏览:1351 次  分类:默认分类
conda是一个包管理器,而anaconda是一个Python发行版。软件发行版是在系统上提前编译和配置好的软件包集合,装好了后就可以直接用。包管理器是自动化软件安装,更新,卸载的一种工具,也是一个可执行命令。conda有命令”conda install”, “conda update”, “conda remove”, 所以很明显, conda是[...]

撰写于:  浏览:1246 次  分类:默认分类
备注:本文修订于2020年6月21日。1、Anaconda简介Anaconda 可以便捷获取包且对包能够进行管理,同时对环境可以统一管理的发行版本。Anaconda包含了conda、Python在内的超过180个科学包及其依赖项。2、Anaconda特点Anaconda具有如下特点:开源 安装过程简单 高性能使用Python和R语言 免费的社区支持[...]

撰写于:  浏览:3053 次  分类:默认分类
面向的读者群体本文收集一些Python新人在学习过程中的一些疑问。这些新人往往是非计算机专业的,转行学习Python编程。问题1问题:在遇到新知识点的时候要选择什么样的学习方式去记忆?我Python学了很多知识点,只是跟着教程练习了一下,当场能记住,但是第二天就忘了,比如很多函数的英文单词,知道有这个函数但是不知道单词怎么拼写,这样的问题是需要反复[...]

撰写于:  浏览:6498 次  分类:默认分类
近日,教育部印发了《教育部关于公布2018年度普通高等学校本科专业备案和审批结果的通知》,经申报、公示、审核等程序,根据普通高等学校专业设置与教学指导委员会评议结果,并征求有关部门意见,确定新增审批专业名单,全国共有35所高校获首批“人工智能”新专业建设资格。另外,96所高校获批“智能科学与技术”专业,203所高校获批“数据科学与大数据技术”专业,[...]

撰写于:  浏览:6002 次  分类:默认分类
西安交通大学从2017年便开始筹备人工智能本科生试验班,并且成立了人工智能本科专业课程设置工作组,由中国工程院院士郑南宁教授领导和主持。经过广泛征求海内外知名教授意见,以及参考世界一流大学相关专业课程的设置,经过多次研讨和修改后,西交大已完成:2018版人工智能本科专业课程设置。据了解,西交大的人工智能本科专业主要包括通识教育、数学与统计、科学与工[...]

撰写于:  浏览:1374 次  分类:默认分类
1、量变与质变只有足够的量才能形成质变。往往100个知识点的理解才能支撑起1个知识点的出神入化,然后从这1个知识点出发,然后回头再看,能将余下的99个知识点串联起来。2、系统化学习与火候系统化学习与火候本质也是量变和质变。

撰写于:  浏览:1331 次  分类:默认分类
说明以下是从其他地方看到的小段子,结合站长的经验进行了修改。其实搞机器学习的工作流程和工作内容,很多情况下,都是大体类似的。正文目前我已经在互联网行业从事机器学习和人工智能方向十年有余,经常也被问到做机器学习算法工程师是一个什么样的体验,同时也常常在其他平台上看到其他人问类似的问题。于是提笔写下此文,供有志投身于这个行业的人参考。一、日常生活读研究[...]

撰写于:  浏览:1444 次  分类:默认分类
知乎提问如何成为算法工程师?怎么成为算法工程师?……这是很多新人的内心疑惑。下面是知乎一位网友的提问:今年研一,感觉自己什么也不会,导师完全放养,2个月没见过面,从入学到现在一个学期快结束了总共见了5次面,没有项目,没有指导,哎想做机器学习方面的工作,距离明年秋招还有一年半,目前在看C++Primer,然后学一学数据结构和算法,同时再学李航的《统计[...]

关注公众号,每天学一个AI知识

    友情链接