SIGAI人工智能平台www.
siai.
cn机器学习与深度学习常见面试题(上)一年一度的校园招聘已经开始了,为了帮助参加校园招聘、社招的同学更好的准备面试,SIGAI整理出了一些常见的机器学习、深度学习面试题.
理解它们,对你通过技术面试非常有帮助,当然,我们不能只限于会做这些题目,最终的目标是真正理解机器学习与深度学习的原理、应用.
1.
比较Boosting和Bagging的异同二者都是集成学习算法,都是将多个弱学习器组合成强学习器的方法.
Bagging:从原始数据集中每一轮有放回地抽取训练集,训练得到k个弱学习器,将这k个弱学习器以投票的方式得到最终的分类结果.
Boosting:每一轮根据上一轮的分类结果动态调整每个样本在分类器中的权重,训练得到k个弱分类器,他们都有各自的权重,通过加权组合的方式得到最终的分类结果.
2.
无监督学习中存在过拟合吗存在.
我们可以使用无监督学习的某些指标或人为地去评估模型性能,以此来判断是否过拟合.
3.
什么是k折交叉验证将原始数据集划分为k个子集,将其中一个子集作为验证集,其余k-1个子集作为训练集,如此训练和验证一轮称为一次交叉验证.
交叉验证重复k次,每个子集都做一次验证集,得到k个模型,加权平均k个模型的结果作为评估整体模型的依据.
4.
关于k折交叉验证,需要注意什么k越大,不一定效果越好,而且越大的k会加大训练时间;在选择k时,需要考虑最小化数据集之间的方差,比如对于2分类任务,采用2折交叉验证,即将原始数据集对半分,若此时训练集中都是A类别,验证集中都是B类别,则交叉验证效果会非常差.
5.
对于一个二分类问题,我们定义超过阈值t的判定为正例,否则判定为负例.
现在若将t增大,则准确率和召回率会如何变化准确率=TP/(TP+FP),召回率=TP/(TP+FN),其中TP表示将正例正确分类为正例的数量,FP表示将负例错误分类为正例的数量,FN表示将正例错误分类为负例的数量.
准确率可以理解为在所有分类为正例的样品中,分类正确的样本所占比例;召回率可以理解为在所有原始数据集中的正例样品中,正确挑出的正例样本的比例.
SIGAI人工智能平台www.
siai.
cn因此若增大阈值t,更多不确定(分类概率较小)的样本将会被分为负例,剩余确定(分类概率较大)的样本所占比例将会增大(或不变),即正确率会增大(或不变);若增大阈值t,则可能将部分不确定(分类概率较小)的正例样品误分类为负例,即召回率会减小(或不变).
6.
以下关于神经网络的说法中,正确的是()A.
增加网络层数,总能减小训练集错误率B.
减小网络层数,总能减小测试集错误率C.
增加网络层数,可能增加测试集错误率C.
增加神经网络层数,确实可能提高模型的泛化性能,但不能绝对地说更深的网络能带来更小的错误率,还是要根据实际应用来判断,比如会导致过拟合等问题,因此只能选C.
7.
说明Lp范数间的区别L1范数:向量中各个元素绝对值之和L2范数:向量中各个元素平方和的开二次方根Lp范数:向量中各个元素绝对值的p次方和的开p次方根8.
用梯度下降训练神经网络的参数,为什么参数有时会被训练为nan值输入数据本身存在nan值,或者梯度爆炸了(可以降低学习率、或者设置梯度的阈值)9.
卷积神经网络CNN中池化层有什么作用减小图像尺寸即数据降维,缓解过拟合,保持一定程度的旋转和平移不变性.
10.
请列举几种常见的激活函数.
激活函数有什么作用sigmoi,relu,tanh.
非线性化11.
神经网络中Dropout的作用具体是怎么实现的防止过拟合.
.
每次训练,都对每个神经网络单元,按一定概率临时丢弃.
12.
利用梯度下降法训练神经网络,发现模型loss不变,可能有哪些问题怎么解决很有可能是梯度消失了,它表示神经网络迭代更新时,有些权值不更新的现象.
改变激活函数,改变权值的初始化等.
13.
如何解决不平衡数据集的分类问题可以扩充数据集,对数据重新采样,改变评价指标等.
14.
残差网络为什么能做到很深层15.
相比sigmoid激活函数ReLU激活函数有什么优势16.
卷积神经网络中膨胀卷积的作用是什么SIGAI人工智能平台www.
siai.
cn17.
解释下卷积神经网络中感受野的概念如何计算感受野如何增大感受野18.
模型欠拟合什么情况下会出现有什么解决方案19.
LSTM的效果为何比RNN好20.
Caffe、TensorFlow、MxNet等框架的优缺点比较21.
多任务学习中标签缺失如何处理22.
梯度爆炸的解决方法23.
深度学习模型参数初始化都有哪些方法24.
注意力机制在深度学习中的作用是什么有哪些场景会使用25.
卷积神经网络为什么会具有平移等不变性26.
神经网络中共享参数是指什么哪些场景会使用27.
如何提高小型网络的精度28.
什么是神经网络的梯度消失问题,为什么会有梯度消失问题有什么办法能缓解梯度消失问题在反向传播算法计算每一层的误差项的时候,需要乘以本层激活函数的导数值,如果导数值接近于0,则多次乘积之后误差项会趋向于0,而参数的梯度值通过误差项计算,这会导致参数的梯度值接近于0,无法用梯度下降法来有效的更新参数的值.
改进激活函数,选用更不容易饱和的函数,如ReLU函数.
29.
列举你所知道的神经网络中使用的损失函数欧氏距离,交叉熵,对比损失,合页损失30.
对于多分类问题,为什么神经网络一般使用交叉熵而不用欧氏距离损失SIGAI人工智能平台www.
siai.
cn交叉熵在一般情况下更容易收敛到一个更好的解.
31.
1x1卷积有什么用途通道降维,保证卷积神经网络可以接受任何尺寸的输入数据32.
随机梯度下降法,在每次迭代时能保证目标函数值一定下降吗为什么不能,每次迭代时目标函数不一样33.
梯度下降法,为什么需要设置一个学习率使得迭代之后的值在上次值的邻域内,保证可以忽略泰勒展开中的二次及二次以上的项34.
解释梯度下降法中动量项的作用利用之前迭代时的梯度值,减小震荡35.
为什么现在倾向于用小尺寸的卷积核用多个小卷积核串联可以有大卷积核同样的能力,而且参数更少,另外有更多次的激活函数作用,增强非线性36.
解释GoogLeNet的Inception模块的原理对输入图像用多个不同尺寸的卷积核、池化操作进行同时处理,然后将输出结果按照通道拼接起来37.
解释反卷积的原理和用途反卷积即转置卷积,正向传播时乘以卷积核的转置矩阵,反向传播时乘以卷积核矩阵由卷积输出结果近似重构输入数据,上采样38.
解释批量归一化的原理在数据送入神经网络的某一层进行处理之前,对数据做归一化.
按照训练样本的批量进行处理,先减掉这批样本的均值,然后除以标准差,然后进行缩放和平移.
缩放和平移参数同训练得到.
预测时使用训练时确定的这些值来计算39.
解释SVM核函数的原理核函数将数据映射到更高维的空间后处理,但不用做这种显式映射,而是先对两个样本向量做内积,然后用核函数映射.
这等价于先进行映射,然后再做内积.
40.
什么是过拟合,过拟合产生的原因是什么有什么方法能减轻过拟合过拟合指在训练集上表现的很好,但在测试集上表现很差,推广泛化能力差.
产生过拟合的原因是训练样本的抽样误差,训练时拟合了这种误差.
增加训练样本,尤其是样本的代表性;正则化41.
什么样的函数可以用作激活函数非线性,几乎处处可到,单调42.
什么是鞍点问题SIGAI人工智能平台www.
siai.
cn梯度为0,Hessian矩阵不定的点,不是极值点43.
在训练深度神经网络的过程中,遇到过哪些问题,怎么解决的不收敛,收敛太慢,泛化能力差.
调整网络结构,调整样本,调整学习率,调整参数初始化策略44.
SVM如何解决多分类问题多个二分类器组合.
1对1方案,1对剩余方案,多类损失函数45.
列举你知道的聚类算法层次聚类,k均值算法,DBSCAN算法,OPTICS算法,谱聚类46.
K均值算法中,初始类中心怎么确定随机选择K个样本作为类中心,将样本随机划分成K个子集然后计算类中心47.
简述EM算法的原理EM算法用于求解带有隐变量的最大似然估计问题.
由于有隐变量的存在,无法直接用最大似然估计求得对数似然函数极大值的公式解.
此时通过jensen不等式构造对数似然函数的下界函数,然后优化下界函数,再用估计出的参数值构造新的下界函数,反复迭代直至收敛到局部极小值点
sharktech怎么样?sharktech鲨鱼机房(Sharktech)我们也叫它SK机房,是一家成立于2003年的老牌国外主机商,提供的产品包括独立服务器租用、VPS主机等,自营机房在美国洛杉矶、丹佛、芝加哥和荷兰阿姆斯特丹等,主打高防产品,独立服务器免费提供60Gbps/48Mpps攻击防御。机房提供1-10Gbps带宽不限流量服务器,最低丹佛/荷兰机房每月49美元起,洛杉矶机房最低59美元...
厦门靠谱云股份有限公司 双十一到了,站长我就给介绍一家折扣力度名列前茅的云厂商——萤光云。1H2G2M的高防50G云服务器,依照他们的规则叠加优惠,可以做到12元/月。更大配置和带宽的价格,也在一般云厂商中脱颖而出,性价比超高。官网:www.lightnode.cn叠加优惠:全区季付55折+满100-50各个配置价格表:地域配置双十一优惠价说明福州(带50G防御)/上海/北京1H2G2M12元/月...
之前几个月由于CHIA挖矿导致全球固态硬盘的价格疯涨,如今硬盘挖矿基本上已死,硬盘的价格基本上恢复到常规价位,所以,pacificrack决定对全系Cloud server进行价格调整,降幅较大,“如果您是老用户,请通过续费管理或升级套餐,获取同步到最新的定价”。官方网站:https://pacificrack.com支持PayPal、支付宝等方式付款VPS特征:基于KVM虚拟,纯SSD raid...
asp.net面试题为你推荐
h连锁酒店连锁酒店有哪些杨紫别祝我生日快乐一个人过生日的伤感说说有什么haokandianyingwang谁有好看电影网站啊、要无毒播放速度快的、在线等www.123qqxx.com我的首页http://www.hao123.com被改成了http://www.669dh.cn/?yhcwww.99vv1.comwww.in9.com是什么网站啊?汴京清谈汴京还被称为什么?莱姿蔓莎琳蒂蔓的护肤怎么样呢?长房娇为什么我的乳晕颜色会越来越深呢?vovokan新白发魔女传41集什么时候播出meansys.com怎样进入博客网站
域名交易 如何申请域名 windows主机 国内永久免费云服务器 kddi mach 工信部icp备案号 免费dns解析 国外ip加速器 流媒体加速 吉林铁通 中国电信宽带测速器 华为云盘 百度云空间 lamp兄弟连 cdn服务 电信主机托管 godaddy中文 美国服务器 comodo 更多