撰写于:  浏览:2382 次  分类:默认分类
算法工程师的行业特点:充斥大量数学公式与其他工作方向,如APP开发、Web开发,游戏开发相比,人工智能尤其是机器学习属于数学知识密集的方向。在各种书籍,论文,算法中都充斥着大量的数学公式,这让很多立志成为算法工程师的人倍感压力。机器学习和深度学习需要学习的数学知识首先我们考虑一个最核心的问题:机器学习和深度学习究竟需要哪些数学知识?请看下面这张表:[...]

撰写于:  浏览:1238 次  分类:默认分类
人类的需求一定有明确需求和不明确需求两大类,搜索代表的是明确的需求,而个性化代表的是不明确需求,所以只要人类有获取信息的需要,个性化推荐一定会伴随人类的发展,一直持续下去。虽然推荐算法不会消亡,但是一定会遇到挑战和变数。推荐算法工程师最大的危机来自于云计算及 AI 的发展,越来越多的云计算公司将 AI 作为云服务的基础能力 (包括推荐能力) 封装起[...]

撰写于:  浏览:1147 次  分类:默认分类
声明本文摘自网络,并做了些修改。写的不错,分享给大家。前言背景:一直有朋友希望我能介绍下自学机器学习、数据挖掘的经历,然而当我认真回首研究生这两年半,发现浪费掉的时间居多,学习的时间太少,积累还不够(虽然校招季收获比较多的数据挖掘相关offer,其实人脉、运气、面试经验等其他因素占了很大比重)。所以在此只能聊聊一些浅显的认识,各位姑妄听之。本文受众[...]

撰写于:  浏览:1236 次  分类:默认分类
作者有多年行业相关经验,走过很多弯路、趟过很多坑,所以这里将我的一些经验教训和建议分享给大家,让大家少走弯路,这些经验即所谓的“道”。其实这些经验和建议也适合很多互联网行业的其他职位,甚至是非互联网行业的职位。(1)关注业务、关注价值产出推荐算法工程师不能只关注自己做了什么,是否保质保量地完成了任务。对公司老板来说,能够为公司创造商业价值才是最关键[...]

撰写于:  浏览:2186 次  分类:默认分类
大家都知道互联网技术方向的职业发展一般有三条道路:第一条是一直做技术成为技术专家;第二条是转管理方向;第三条是做到一定程度转行到周边方向,如产品、项目经理等。在国内,多少对年纪大了的技术人员有一定的偏见,认为年纪大了干不动了,所以大家都愿意往管理方向发展。其实,在国外做技术是非常自信和自豪的事情,听说在 Google 技术人员的地位非常高,只有技术[...]

撰写于:  浏览:1301 次  分类:默认分类
个性化推荐系统,简单来说就是根据每个人的偏好推荐他喜欢的物品。互联网发展到现在,推荐系统已经无处不在,在各行各业都得到普遍都应用。亚马逊号称 40% 的收入是来自个性化推荐系统的,淘宝的个性化推荐系统也带来非常大的收益,新闻媒体的个性化推荐系统典型的是今日头条。除此以外,直播平台给用户推荐喜欢的主播,金融网站给用户推荐需要的理财产品,社交网络给用户[...]

撰写于:  浏览:1229 次  分类:默认分类
在很多外行人眼中,算法工程师的工作应该是:拿到最近某大神新发的Paper,或者自己钻研理论推公式产出研究成果,通过并行编程实现大规模数据训练,然后打败现有模型,CTR提升200%,收入提高200%。然而实际情况往往并不是这样的。理想中的算法工程师:提出假设->收集数据->训练模型->产出成果。实际中的算法工程师:提出假设->[...]

撰写于:  浏览:1176 次  分类:默认分类
算法工程师可投递简历的工作岗位有:机器学习 | 数据挖掘 | 算法工程师 | 基础研究一面考察要点:(1)C/C++,Python等开发语言的语法问题,例如:C++里面const有什么作用,C++里面static的作用等,主要考察应试者的对开发语言的掌握程度。(2)除了基本的语法规则考察以外,还会考察一下算法和数据结构题目,例如:判断一个数字是否为[...]

撰写于:  浏览:1285 次  分类:机器学习电子书
建好模型之后,必须对它进行评价,我们经常会使用一些评价指标来比较模型的预测准确度。常用的评价指标有:预测准确率,混淆矩阵,均方根误差等。1、分类指标1.1、预测准确率简单的说,就是正确的预测所占的比例。虽然它很简单容易理解,但是我们无法通过它得知预测误差是如何产生的。1.2、混淆矩阵混淆矩阵可以进一步了解预测模型的优缺点。通过样本的采集,我们能够直[...]

撰写于:  浏览:1313 次  分类:机器学习电子书
常用指标有3个:(1){X}的支持度表示X项出现的频率,可以表示为P(X)(2){X→Y}的置信度表示当X项出现时Y项同时出现的频率,可以表示为:P(XY)/P(X)(3){X→Y}的提升度表示X项和Y项一同出现的频率,并且考虑每项各自出现的频率,可以表示为:P(XY)/P(X)P(Y)。公式看起来很容易理解,但是在实际问题中,我们常用被项集这个概[...]

撰写于:  浏览:1143 次  分类:机器学习电子书
主成分可以用已有的一个或多个变量表示。 比如,可以使用生素C这个变量来区分不同的食物。因为蔬菜含维生素C而肉类普遍缺乏,所以可以通过维生素C这个变量区分蔬菜和肉类,但是无法进步区分不同的肉类。为了进一步区分不同的肉类,可以选择把脂肪含量作为第2个变量,因为肉类含有脂肪,而大部分蔬菜则不然。由于脂肪和维生素C的计量单位不同,因此在组合之前,必须先对它[...]

撰写于:  浏览:1457 次  分类:机器学习电子书
尽管K均值聚类方法很有用,但是它有一定的局限:(1)每个数据点只能属于一个群组。然而,数据点可能恰好位于两个群组中间,无法通过k均值聚类方法确定它应该属于哪个群组(2)群组被假定是正圆形的。查找距离某个群组中心点最近的数据点,这一迭代过程类似于缩小群组的半径,因此最终得到的群组在形状上类似于正圆形。假设群组的实际形状是椭圆形,那么在应用k均值聚类方[...]

撰写于:  浏览:1262 次  分类:机器学习电子书
机器学习一般包含两类参数:超参数和参数。超参数的数目通常不多,在10以内。参数的数目可能很多,如卷积神经网络中有近千万个参数(权重)。曲线拟合中,方程的次数就是超参数,多项式的系数就是参数。这两种参数的调参方式不同,超参数取值一般是人工设定的,参数值是根据参数优化算法自动寻优的。超参数的取值对模型泛化性能有重大的影响,验证集就是用来决定最优超参数取值的。

撰写于:  浏览:1276 次  分类:机器学习电子书
计算机“看”不到图像的内容,对它而言,图像是巨大的数值,即数值矩阵,矩阵元素表示像素的颜色信息。例如,某幅图像分群率为1280 x 720,表示图像有1280 x 720个像素点,则存储为1280 x 720的矩阵。对于彩色图像,每个像素点有红、绿、蓝( RGB)3个颜色的通道值,每个值在0(黑)到255(白)之间。对于灰度图像,每个像素点有亮度1[...]

撰写于:  浏览:1172 次  分类:机器学习电子书
如果输人的数值属性具有非常大的比例差异,往往导致机器学习算法的性能表现不佳,当然也有极少数特例。案例中的房屋数据就是这样:房间总数的范围从6到39 320,而收入中位数的范围是0到15。注意,目标值通常不需要缩放。同比例缩放所有属性,常用的两种方法是:最小-最大缩放和标准化。最小-最大缩放,又叫作归一化,很简单:将值重新缩放使其最终范围归于0到1之[...]

关注公众号,每天学一个AI知识

    友情链接