实用范文
《搜狗校招笔试题》Word格式可编辑含目录精心整理放心阅读欢迎下载
文档信息
搜狗校招笔试题
目录
A特征灵活
B速度快
C可容纳较多上下文信息
D全局最优
A 1/2 1/2
B 25/102 12/50
C 50/51 24/25
D 25/51 12/25
A ID3算法要求特征必须离散化
B信息增益可以用熵而不是GINI系数来计算
C选取信息增益最大的特征作为树的根节点
D ID3算法是一个二叉树模型
正文
搜狗2015校招笔试题
①、机器学习
下列哪个不属于CRF模型对于HMM和MEMM模型的优势( )
A特征灵活
B速度快
C可容纳较多上下文信息
D全局最优
答案 B
解析 HMM模型是对转移概率和表现概率直接建模统计共现概率。而ME MM模型是对转移概率和表现概率建立联合概率统计时统计的是条件概率。 CRF是在给定需要标记的观察序列的条件下计算整个标记序列的联合概率分布而不是在给定当前状态条件下定义下一个状态的状态分布。 M EMM容易陷入局部最优是因为M EMM只在局部做归一化。 CRF模型中统计了全局概率在做归一化时考虑了数据在全局的分布而不是仅仅在局部归一化这样就解决了M EMM中的标记偏置的.问题。
C RF没有HMM那样严格的独立性假设条件 因而可以容纳任意的上下文信息特征设计灵活。 C RF需要训练的参数更多与M EMM和HMM相比它存在训练代价大、复杂度高的缺点。
②、概率
假设一个完整的扑克牌有52张牌 2黑色(黑葵和梅花)和2红色(方块和红心) 。如果给你一副完整的牌和半副牌(1红色和1黑色) 则两种情况下抽两张牌都是红色的概率是多少( )
A 1/2 1/2
B 25/102 12/50
C 50/51 24/25
D 25/51 12/25
答案 B
解析一副牌第一张为红色的概率为26/52第二张为红色的概率为25/51两张都为红色的概率为 26/52*25/51=25/102
半副牌第一张为红色的概率为13/26第二张为红色的概率为12/25两张都为红色的概率为 13/26*12/25=12/50
③、机器学习
下面关于ID3算法中说法错误的是( )
A ID3算法要求特征必须离散化
B信息增益可以用熵而不是GINI系数来计算
C选取信息增益最大的特征作为树的根节点
D ID3算法是一个二叉树模型
答案 D
解析 ID3算法的核心思想是以信息增益度量属性选择选择分裂后信息增益最大的属性进行分裂。 ID3算法的局限是它的属性只能取离散值为了使决策树能应用于连续属性值情况可以使用ID3的一个
扩展算法算法。 BC选项都是ID3算法的特点。 ID3算法生成的决策树是一棵多叉树分支的数量取决于分裂属性有多少个不同的取值。因此D选项错误。
为提高学习交流本文整理了相关的实用范文有 《网易2015校招笔试题》 、 《腾讯2015校招笔试题》 、 《搜狗招聘笔试题分享》 、 《搜狗笔试题目》 、 《搜狐校招笔试题》 、 《2015年搜狐校招产品经理笔试题》 、 《2015年互联网公司校招笔试题目汇总》 、 《2015阿里校招数据产品经理笔试题》 读者可以在平台上搜索。
“搜狗校招笔试题”文档源于网络本人编辑整理。本着保护作者知识产权的原则仅供学习交流请勿商用。如有侵犯作者权益请作者留言或者发站内信息联系本人我将尽快删除。谢谢您的阅读与下载
数脉科技(shuhost)8月促销:香港独立服务器,自营BGP、CN2+BGP、阿里云线路,新客立减400港币/月,老用户按照优惠码减免!香港服务器带宽可选10Mbps、30Mbps、50Mbps、100Mbps带宽,支持中文本Windows、Linux等系统。官方网站:https://www.shuhost.com* 更大带宽可在选购时选择同样享受优惠。* 目前仅提供HKBGP、阿里云产品,香港...
近期联通CUVIP的线路(AS4837线路)非常火热,妮妮云也推出了这类线路的套餐以及优惠,目前到国内优质线路排行大致如下:电信CN2 GIA>联通AS9929>联通AS4837>电信CN2 GT>普通线路,AS4837线路比起前两的优势就是带宽比较大,相对便宜一些,所以大家才能看到这个线路的带宽都非常高。妮妮云互联目前云服务器开放抽奖活动,每天开通前10台享3折优惠,另外...
imidc对日本独立服务器在搞特别促销,原价159美元的机器现在只需要88美元,而且给13个独立IPv4,30Mbps直连带宽,不限制流量。注意,本次促销只有一个链接,有2个不同的优惠码,你用不同的优惠码就对应着不同的配置,价格也不一样。88美元的机器,下单后默认不管就给512G SSD,要指定用HDD那就发工单,如果需要多加一个/28(13个)IPv4,每个月32美元...官方网站:https:...