海量人脸识别百度人脸识别搜索是怎么实现的

海量人脸识别  时间:2022-02-13  阅读:()

百度人脸识别搜索是怎么实现的

在经历两年多的沉寂之后,百度识图开始向另一个方向探索。   上周的百度年会中,李彦宏特意提到百度识图:“以图搜图的准确率从20%提升到80%”。不过与之前相比,百度识图找到相似图片的能力似乎并未显著提升,那么改变从何而来?李彦宏把这种明显的提升归因于刚上线的人脸识别搜索。   与之前的区别在于,如果用户给出一张图片,百度识图会判断里面是否出现人脸,如果有,百度识图在相似图片搜索之外,同时会全网寻找出现过的类似人像。   新增加的技术简而言之,首先是人脸检测并提取出特征表达,随后再据此进行数据库对比,最后按照相似度排序返回结果。其实,人脸检测并不是新技术,相关研究已有三十年历史,然而直到去年底,百度才决定推动这一技术付诸实施。   这里面自然有战略层面的考虑。两年前,李彦宏就对未来做出读图时代的判断;去年的KDD大会上,李彦宏提出的九大待解技术挑战中,基于内容的图像搜索技术被列在第三;现实层面百度的图片相关产品、云相册等均对这一技术有需求。   百度还希望借助这一途径,挖掘图片之间的联系,进而激发二次浏览。然而要把想法变为现实,百度至少要解决两个问题:一是算法,二是数据。   ——算法方面。同样是基于图片进行搜索,人脸识别和以图搜图并不一样。百度资深工程师陶吉告诉创事记,百度人脸识别首先并不关注完整的图像结构,其次颜色也没有任何意义。最主要的特征表达来自于脸部纹理,并进行一些再加工。   具体算法作为商业机密,难以对外界披露。不过资料显示,目前人脸识别算法中LBP是比较流行的一种特征提取方式,即通过像素周边8个临近像素的灰度值和中心灰度值比较,得到一个八位编码,然后再根据编码的直方图进行分类。   而影响算法效果的因素还可能包括预处理、特征选择、特征点定位精度、分类器设计和后处理乃至各种方式的融合、阈值选择等各个方面。   一张图片中,人脸至少有40×40像素(约一个指甲盖大小),才会被当作有效的识别对象。如果一张图片中多个人像,目前百度的解决办法是仅识别尺寸最大的那个,未来百度将提供焦点选择功能,用户可以通过选点确定搜索对象。   ——数据方面。算法的改善如果算是充分条件,数据的处理则是必要条件。从机器搜索的角度看,光照、姿态、表情、角度等因素,均是影响巨大的因素,所谓“笑和不笑,都是不同”。所以用来训练的数据量越大,变化的包容性就越好。   人脸识别搜索实际使用时,同一张人脸积累的数据越多,越能在匹配对比时提供更好的支持。为此百度需要把全网近百亿规模的图片抽取出来,然后把没有人脸的数据去掉,再海量扫描一遍,建立起尽量高效的索引。   人脸识别引入搜索引擎,必然会加剧外界关于隐私泄漏的担心。百度强调人脸搜索只会在公开的信息范围内进行,封闭的个人相册并不会被触及。   这还涉及准确率、召回率等概念。假设数据库里有一百张刘德华的图片,用刘德华的头像发起搜索,前50张结果中40张是真正的刘德华,那么前50张的召回率就是40%,准确率是80%。同样假如数据库中只有两张路人甲的图片,当用路人甲的头像发起搜索,前50张可能只有1张真正的路人甲,那么前50张的召回率是50%,准确率是2%。   由于名人在网上的照片较多,能被用户感知到的准确率要比普通人高很多,而召回率是用户感知不到的。据透露,人脸识别搜索技术会在百度云相册内部进一步结合,帮助用户在图片之间建立联系,而且未来不排除开放API的可能。   除了上述技术讨论之外,从百度的研发体系看,人脸识别搜索也颇具代表性。   这个先后投入几十个工程师、百度基础技术部的多媒体部门负责核心算法的项目,去年11月下旬立项,12月底就已经上线运行。这个速度在百度并不常见,因此也有人半开玩笑的说这是百度近期“改作风”运动成效的代表。   值得注意的是百度新成立的基础技术部。这个部门由百度首席科学家王海峰带领,并且直接向李彦宏汇报。据说一些李彦宏会亲自参与一些重点项目。自然语言处理、互联网数据挖掘、多媒体、推荐和个性化等技术研发,均由百度基础技术部负责。   还是在百度年会上,谈及近期遇到的挑战,李彦宏称百度不会忽视渠道的价值,但技术才是未来产业的关键。“相信技术的力量,未来就在我们手里”,李彦宏发出这样的号召。显然,百度的“变奏”已是必然要上演。

RAKsmart美国洛杉矶独立服务器 E3-1230 16GB内存 限时促销月$76

RAKsmart 商家我们应该较多的熟悉的,主营独立服务器和站群服务器业务。从去年开始有陆续的新增多个机房,包含韩国、日本、中国香港等。虽然他们家也有VPS主机,但是好像不是特别的重视,价格上特价的时候也是比较便宜的1.99美元月付(年中活动有促销)。不过他们的重点还是独立服务器,毕竟在这个产业中利润率较大。正如上面的Megalayer商家的美国服务器活动,这个同学有需要独立服务器,这里我一并整理...

BeerVM1GB内存/VDSps端口1GB,350元/月

beervm是一家国人商家,主要提供国内KVM VPS,有河南移动、广州移动等。现在预售湖南长沙联通vds,性价比高。湖南长沙vps(长沙vds),1GB内存/7GB SSD空间/10TB流量/1Gbps端口/独立IP/KVM,350元/月,有需要的可以关注一下。Beervm长沙联通vps套餐:长沙联通1G青春版(预售)长沙联通3G标准版(预售)长沙联通3G(预售)vCPU:1vCPU:2vCPU...

华圣云 HuaSaint-阿里云国际站一级分销商,只需一个邮箱即可注册国际账号,可代充值

简介华圣云 HuaSaint是阿里云国际版一级分销商(诚招募二级代理),专业为全球企业客户与个人开发者提供阿里云国际版开户注册、认证、充值等服务,通过HuaSaint开通阿里云国际版只需要一个邮箱,不需要PayPal信用卡,不需要买海外电话卡,绝对的零门槛,零风险官方网站:www.huasaint.com企业名:huaSaint Tech Limited阿里云国际版都有什么优势?阿里云国际版的产品...

海量人脸识别为你推荐
hotmail comoutlook.com和hotmail.com哪个好?有什么区别虚拟主机搭建网站教程如何在虚拟主机上搭建一个网站虚拟主机建网站用虚拟主机方式拟建网站需要那些环节美国云虚拟主机美国云主机与美国虚拟主机有什么区别虚拟主机ssl证书安装教程如何在Win2003+IIS6.0下安装SSL证书那里我便宜的虚拟主机有没有便宜点的com域名或者便宜的cn域名啊?那里有哦?还有便宜点的虚拟主机空间、cdn虚拟主机虚拟主机怎么使用?服务器/虚拟主机租用虚拟主机和服务器合租分别是什么概念上海千兆虚拟主机上海电信网通单线双线idc服务器托管中国云网 虚拟主机虚拟主机支持的程序语言有哪些?各语言都有什么特点啊? 见云网 的Linux主机怎么样?
什么是虚拟主机 什么是域名 如何注册网站域名 ipage 本网站服务器在美国 智能骨干网 linux空间 刀片服务器是什么 web服务器的架设 hostloc 刀片式服务器 google台湾 个人免费邮箱 注册阿里云邮箱 广东主机托管 阵亡将士纪念日 万网服务器 shuangcheng 亿库 apache启动失败 更多