SIGAI人工智能平台www.
siai.
cn机器学习与深度学习常见面试题(上)一年一度的校园招聘已经开始了,为了帮助参加校园招聘、社招的同学更好的准备面试,SIGAI整理出了一些常见的机器学习、深度学习面试题.
理解它们,对你通过技术面试非常有帮助,当然,我们不能只限于会做这些题目,最终的目标是真正理解机器学习与深度学习的原理、应用.
1.
比较Boosting和Bagging的异同二者都是集成学习算法,都是将多个弱学习器组合成强学习器的方法.
Bagging:从原始数据集中每一轮有放回地抽取训练集,训练得到k个弱学习器,将这k个弱学习器以投票的方式得到最终的分类结果.
Boosting:每一轮根据上一轮的分类结果动态调整每个样本在分类器中的权重,训练得到k个弱分类器,他们都有各自的权重,通过加权组合的方式得到最终的分类结果.
2.
无监督学习中存在过拟合吗存在.
我们可以使用无监督学习的某些指标或人为地去评估模型性能,以此来判断是否过拟合.
3.
什么是k折交叉验证将原始数据集划分为k个子集,将其中一个子集作为验证集,其余k-1个子集作为训练集,如此训练和验证一轮称为一次交叉验证.
交叉验证重复k次,每个子集都做一次验证集,得到k个模型,加权平均k个模型的结果作为评估整体模型的依据.
4.
关于k折交叉验证,需要注意什么k越大,不一定效果越好,而且越大的k会加大训练时间;在选择k时,需要考虑最小化数据集之间的方差,比如对于2分类任务,采用2折交叉验证,即将原始数据集对半分,若此时训练集中都是A类别,验证集中都是B类别,则交叉验证效果会非常差.
5.
对于一个二分类问题,我们定义超过阈值t的判定为正例,否则判定为负例.
现在若将t增大,则准确率和召回率会如何变化准确率=TP/(TP+FP),召回率=TP/(TP+FN),其中TP表示将正例正确分类为正例的数量,FP表示将负例错误分类为正例的数量,FN表示将正例错误分类为负例的数量.
准确率可以理解为在所有分类为正例的样品中,分类正确的样本所占比例;召回率可以理解为在所有原始数据集中的正例样品中,正确挑出的正例样本的比例.
SIGAI人工智能平台www.
siai.
cn因此若增大阈值t,更多不确定(分类概率较小)的样本将会被分为负例,剩余确定(分类概率较大)的样本所占比例将会增大(或不变),即正确率会增大(或不变);若增大阈值t,则可能将部分不确定(分类概率较小)的正例样品误分类为负例,即召回率会减小(或不变).
6.
以下关于神经网络的说法中,正确的是()A.
增加网络层数,总能减小训练集错误率B.
减小网络层数,总能减小测试集错误率C.
增加网络层数,可能增加测试集错误率C.
增加神经网络层数,确实可能提高模型的泛化性能,但不能绝对地说更深的网络能带来更小的错误率,还是要根据实际应用来判断,比如会导致过拟合等问题,因此只能选C.
7.
说明Lp范数间的区别L1范数:向量中各个元素绝对值之和L2范数:向量中各个元素平方和的开二次方根Lp范数:向量中各个元素绝对值的p次方和的开p次方根8.
用梯度下降训练神经网络的参数,为什么参数有时会被训练为nan值输入数据本身存在nan值,或者梯度爆炸了(可以降低学习率、或者设置梯度的阈值)9.
卷积神经网络CNN中池化层有什么作用减小图像尺寸即数据降维,缓解过拟合,保持一定程度的旋转和平移不变性.
10.
请列举几种常见的激活函数.
激活函数有什么作用sigmoi,relu,tanh.
非线性化11.
神经网络中Dropout的作用具体是怎么实现的防止过拟合.
.
每次训练,都对每个神经网络单元,按一定概率临时丢弃.
12.
利用梯度下降法训练神经网络,发现模型loss不变,可能有哪些问题怎么解决很有可能是梯度消失了,它表示神经网络迭代更新时,有些权值不更新的现象.
改变激活函数,改变权值的初始化等.
13.
如何解决不平衡数据集的分类问题可以扩充数据集,对数据重新采样,改变评价指标等.
14.
残差网络为什么能做到很深层15.
相比sigmoid激活函数ReLU激活函数有什么优势16.
卷积神经网络中膨胀卷积的作用是什么SIGAI人工智能平台www.
siai.
cn17.
解释下卷积神经网络中感受野的概念如何计算感受野如何增大感受野18.
模型欠拟合什么情况下会出现有什么解决方案19.
LSTM的效果为何比RNN好20.
Caffe、TensorFlow、MxNet等框架的优缺点比较21.
多任务学习中标签缺失如何处理22.
梯度爆炸的解决方法23.
深度学习模型参数初始化都有哪些方法24.
注意力机制在深度学习中的作用是什么有哪些场景会使用25.
卷积神经网络为什么会具有平移等不变性26.
神经网络中共享参数是指什么哪些场景会使用27.
如何提高小型网络的精度28.
什么是神经网络的梯度消失问题,为什么会有梯度消失问题有什么办法能缓解梯度消失问题在反向传播算法计算每一层的误差项的时候,需要乘以本层激活函数的导数值,如果导数值接近于0,则多次乘积之后误差项会趋向于0,而参数的梯度值通过误差项计算,这会导致参数的梯度值接近于0,无法用梯度下降法来有效的更新参数的值.
改进激活函数,选用更不容易饱和的函数,如ReLU函数.
29.
列举你所知道的神经网络中使用的损失函数欧氏距离,交叉熵,对比损失,合页损失30.
对于多分类问题,为什么神经网络一般使用交叉熵而不用欧氏距离损失SIGAI人工智能平台www.
siai.
cn交叉熵在一般情况下更容易收敛到一个更好的解.
31.
1x1卷积有什么用途通道降维,保证卷积神经网络可以接受任何尺寸的输入数据32.
随机梯度下降法,在每次迭代时能保证目标函数值一定下降吗为什么不能,每次迭代时目标函数不一样33.
梯度下降法,为什么需要设置一个学习率使得迭代之后的值在上次值的邻域内,保证可以忽略泰勒展开中的二次及二次以上的项34.
解释梯度下降法中动量项的作用利用之前迭代时的梯度值,减小震荡35.
为什么现在倾向于用小尺寸的卷积核用多个小卷积核串联可以有大卷积核同样的能力,而且参数更少,另外有更多次的激活函数作用,增强非线性36.
解释GoogLeNet的Inception模块的原理对输入图像用多个不同尺寸的卷积核、池化操作进行同时处理,然后将输出结果按照通道拼接起来37.
解释反卷积的原理和用途反卷积即转置卷积,正向传播时乘以卷积核的转置矩阵,反向传播时乘以卷积核矩阵由卷积输出结果近似重构输入数据,上采样38.
解释批量归一化的原理在数据送入神经网络的某一层进行处理之前,对数据做归一化.
按照训练样本的批量进行处理,先减掉这批样本的均值,然后除以标准差,然后进行缩放和平移.
缩放和平移参数同训练得到.
预测时使用训练时确定的这些值来计算39.
解释SVM核函数的原理核函数将数据映射到更高维的空间后处理,但不用做这种显式映射,而是先对两个样本向量做内积,然后用核函数映射.
这等价于先进行映射,然后再做内积.
40.
什么是过拟合,过拟合产生的原因是什么有什么方法能减轻过拟合过拟合指在训练集上表现的很好,但在测试集上表现很差,推广泛化能力差.
产生过拟合的原因是训练样本的抽样误差,训练时拟合了这种误差.
增加训练样本,尤其是样本的代表性;正则化41.
什么样的函数可以用作激活函数非线性,几乎处处可到,单调42.
什么是鞍点问题SIGAI人工智能平台www.
siai.
cn梯度为0,Hessian矩阵不定的点,不是极值点43.
在训练深度神经网络的过程中,遇到过哪些问题,怎么解决的不收敛,收敛太慢,泛化能力差.
调整网络结构,调整样本,调整学习率,调整参数初始化策略44.
SVM如何解决多分类问题多个二分类器组合.
1对1方案,1对剩余方案,多类损失函数45.
列举你知道的聚类算法层次聚类,k均值算法,DBSCAN算法,OPTICS算法,谱聚类46.
K均值算法中,初始类中心怎么确定随机选择K个样本作为类中心,将样本随机划分成K个子集然后计算类中心47.
简述EM算法的原理EM算法用于求解带有隐变量的最大似然估计问题.
由于有隐变量的存在,无法直接用最大似然估计求得对数似然函数极大值的公式解.
此时通过jensen不等式构造对数似然函数的下界函数,然后优化下界函数,再用估计出的参数值构造新的下界函数,反复迭代直至收敛到局部极小值点
官方网站:点击访问青果云官方网站活动方案:—————————–活动规则—————————1、选购活动产品并下单(先不要支付)2、联系我司在线客服修改价格或领取赠送时间3、确认价格已按活动政策修改正确后,支付订单,到此产品开设成功4、本活动产品可以升级,升级所需费用按产品原价计算若发生退款,按资源实际使用情况折算为产品原价再退还剩余余额! 美国洛杉矶CN2_GIACPU内存系统盘流量宽带i...
在之前的一些文章中有提到HostYun商家的信息,这个商家源头是比较老的,这两年有更换新的品牌域名。在陆续的有新增机房,价格上还是走的低价格路线,所以平时的折扣力度已经是比较低的。在前面我也有介绍到提供九折优惠,这个品牌商家就是走的低价量大为主。中秋节即将到,商家也有推出稍微更低的88折。全场88折优惠码:moon88这里,整理部分HostYun商家的套餐。所有的价格目前都是原价,我们需要用折扣码...
香港云服务器最便宜价格是多少钱一个月/一年?无论香港云服务器推出什么类型的配置和活动,价格都会一直吸引我们,那么就来说说香港最便宜的云服务器类型和香港最低的云服务器价格吧。香港云服务器最便宜最低价的价格是多少?香港云服务器只是服务器中最受欢迎的产品。香港云服务器有多种配置类型,如1核1G、2核2G、2核4G、8到16核32G等。这些配置可以满足大多数用户的需求,无论是电商站、视频还是游戏、小说等。...
asp.net面试题为你推荐
网易网盘关闭入口网易网盘怎么用????h连锁酒店连锁酒店有哪些sonicchat苹果手机微信显示WeChat老虎数码我想买个一千左右的数码相机!最好低于一千五!再给我说一下像素是多少?22zizi.comwww 地址 didi22怎么打不开了,还有好看的吗>comxyq.163.cbg.com梦幻西游里,CBG是什么?在那里,能帮忙详细说一下吗百度关键词分析关键词怎么分析?5xoy.comhttp www.05eee.com杨丽晓博客明星的最新博文www.03024.comwww.sohu.com是什么
代理域名备案 过期域名抢注 息壤主机 cpanel主机 2014年感恩节 正版win8.1升级win10 服务器cpu性能排行 免空 柚子舍官网 服务器干什么用的 免费美国空间 空间合租 免费测手机号 安徽双线服务器 监控服务器 国外在线代理服务器 php服务器 lamp兄弟连 测试网速命令 域名和主机 更多