海量人脸识别百度人脸识别搜索是怎么实现的

海量人脸识别  时间:2022-02-13  阅读:()

百度人脸识别搜索是怎么实现的

在经历两年多的沉寂之后,百度识图开始向另一个方向探索。   上周的百度年会中,李彦宏特意提到百度识图:“以图搜图的准确率从20%提升到80%”。不过与之前相比,百度识图找到相似图片的能力似乎并未显著提升,那么改变从何而来?李彦宏把这种明显的提升归因于刚上线的人脸识别搜索。   与之前的区别在于,如果用户给出一张图片,百度识图会判断里面是否出现人脸,如果有,百度识图在相似图片搜索之外,同时会全网寻找出现过的类似人像。   新增加的技术简而言之,首先是人脸检测并提取出特征表达,随后再据此进行数据库对比,最后按照相似度排序返回结果。其实,人脸检测并不是新技术,相关研究已有三十年历史,然而直到去年底,百度才决定推动这一技术付诸实施。   这里面自然有战略层面的考虑。两年前,李彦宏就对未来做出读图时代的判断;去年的KDD大会上,李彦宏提出的九大待解技术挑战中,基于内容的图像搜索技术被列在第三;现实层面百度的图片相关产品、云相册等均对这一技术有需求。   百度还希望借助这一途径,挖掘图片之间的联系,进而激发二次浏览。然而要把想法变为现实,百度至少要解决两个问题:一是算法,二是数据。   ——算法方面。同样是基于图片进行搜索,人脸识别和以图搜图并不一样。百度资深工程师陶吉告诉创事记,百度人脸识别首先并不关注完整的图像结构,其次颜色也没有任何意义。最主要的特征表达来自于脸部纹理,并进行一些再加工。   具体算法作为商业机密,难以对外界披露。不过资料显示,目前人脸识别算法中LBP是比较流行的一种特征提取方式,即通过像素周边8个临近像素的灰度值和中心灰度值比较,得到一个八位编码,然后再根据编码的直方图进行分类。   而影响算法效果的因素还可能包括预处理、特征选择、特征点定位精度、分类器设计和后处理乃至各种方式的融合、阈值选择等各个方面。   一张图片中,人脸至少有40×40像素(约一个指甲盖大小),才会被当作有效的识别对象。如果一张图片中多个人像,目前百度的解决办法是仅识别尺寸最大的那个,未来百度将提供焦点选择功能,用户可以通过选点确定搜索对象。   ——数据方面。算法的改善如果算是充分条件,数据的处理则是必要条件。从机器搜索的角度看,光照、姿态、表情、角度等因素,均是影响巨大的因素,所谓“笑和不笑,都是不同”。所以用来训练的数据量越大,变化的包容性就越好。   人脸识别搜索实际使用时,同一张人脸积累的数据越多,越能在匹配对比时提供更好的支持。为此百度需要把全网近百亿规模的图片抽取出来,然后把没有人脸的数据去掉,再海量扫描一遍,建立起尽量高效的索引。   人脸识别引入搜索引擎,必然会加剧外界关于隐私泄漏的担心。百度强调人脸搜索只会在公开的信息范围内进行,封闭的个人相册并不会被触及。   这还涉及准确率、召回率等概念。假设数据库里有一百张刘德华的图片,用刘德华的头像发起搜索,前50张结果中40张是真正的刘德华,那么前50张的召回率就是40%,准确率是80%。同样假如数据库中只有两张路人甲的图片,当用路人甲的头像发起搜索,前50张可能只有1张真正的路人甲,那么前50张的召回率是50%,准确率是2%。   由于名人在网上的照片较多,能被用户感知到的准确率要比普通人高很多,而召回率是用户感知不到的。据透露,人脸识别搜索技术会在百度云相册内部进一步结合,帮助用户在图片之间建立联系,而且未来不排除开放API的可能。   除了上述技术讨论之外,从百度的研发体系看,人脸识别搜索也颇具代表性。   这个先后投入几十个工程师、百度基础技术部的多媒体部门负责核心算法的项目,去年11月下旬立项,12月底就已经上线运行。这个速度在百度并不常见,因此也有人半开玩笑的说这是百度近期“改作风”运动成效的代表。   值得注意的是百度新成立的基础技术部。这个部门由百度首席科学家王海峰带领,并且直接向李彦宏汇报。据说一些李彦宏会亲自参与一些重点项目。自然语言处理、互联网数据挖掘、多媒体、推荐和个性化等技术研发,均由百度基础技术部负责。   还是在百度年会上,谈及近期遇到的挑战,李彦宏称百度不会忽视渠道的价值,但技术才是未来产业的关键。“相信技术的力量,未来就在我们手里”,李彦宏发出这样的号召。显然,百度的“变奏”已是必然要上演。

Gigsgigscloud($9.8)联通用户优选日本软银VPS

gigsgigsCloud日本东京软银VPS的大带宽配置有100Mbps、150Mbps和200Mbps三种,三网都走软银直连,售价最低9.8美元/月、年付98美元。gigsgigscloud带宽较大延迟低,联通用户的好选择!Gigsgigscloud 日本软银(BBTEC, SoftBank)线路,在速度/延迟/价格方面,是目前联通用户海外VPS的最佳选择,与美国VPS想比,日本软银VPS延迟更...

盘点AoYoZhuJi傲游主机商8个数据中心常见方案及八折优惠

傲游主机商我们可能很多人并不陌生,实际上这个商家早年也就是个人主机商,传说是有几个个人投资创办的,不过能坚持到现在也算不错,毕竟有早年的用户积累正常情况上还是能延续的。如果是新服务商这几年确实不是特别容易,问到几个老牌的个人服务商很多都是早年的用户积累客户群。傲游主机目前有提供XEN和KVM架构的云服务器,不少还是亚洲CN2优化节点,目前数据中心包括中国香港、韩国、德国、荷兰和美国等多个地区的CN...

sharktech:洛杉矶/丹佛/荷兰高防服务器;1G独享$70/10G共享$240/10G独享$800

sharktech怎么样?sharktech (鲨鱼机房)是一家成立于 2003 年的知名美国老牌主机商,又称鲨鱼机房或者SK 机房,一直主打高防系列产品,提供独立服务器租用业务和 VPS 主机,自营机房在美国洛杉矶、丹佛、芝加哥和荷兰阿姆斯特丹,所有产品均提供 DDoS 防护。不知道大家是否注意到sharktech的所有服务器的带宽价格全部跳楼跳水,降幅简直不忍直视了,还没有见过这么便宜的独立服...

海量人脸识别为你推荐
什么是免费虚拟主机虚拟主机是什么东西?做什么用的?虚拟主机搭建网站教程怎么免费建站免备案虚拟主机空间国内独立IP空间可以免备案?wamp虚拟主机如何配置 Apache 的虚拟主机虚拟主机可以打游戏吗虚拟机玩单机dnf要联网吗虚拟主机哪里购买想买个同时支持php和.net的虚拟主机,哪里可以买到这样的空间?是同时支持的那种。阿里云共享虚拟主机阿里云虚拟主机是什么网站服务器免费虚拟主机博客免費網址怎麼建的?免费虚拟主机哪里有虚拟机哪里下载啊?怎么安装呢?n点虚拟主机 连接网络失败...虚拟计算机怎么连不上网!该怎么办!
百度域名 香港服务器租用 鲁诺vps namecheap jsp主机 NetSpeeder 个人空间申请 小米数据库 admit的用法 cdn联盟 1g内存 傲盾官网 中国网通测速 个人免费主页 河南移动梦网 万网空间 可外链的相册 免费网络空间 阿里云邮箱怎么注册 葫芦机 更多