视觉搜索淘淘搜用张图片找淘宝同款
来源: i天下网商 发布时间 2014-3-25
亿邦动力网整理
【编者按】搜索的核心应用在于场景。尽管今天的文本搜索已经达到了成熟的阶段但对于消费者来说词不达意的模糊搜索依然大量出现。对于搜索技术公司而言用一张图来找同款的搜索方式便成了创业的机会。
作为图像搜索购物领域的佼佼者淘淘搜CEO林建聪为其产品构建的应用场景如下当用户在淘宝上搜到某款心仪服装却希望找到更便宜的价格时只需将该图片的网页地址输入到淘淘搜的搜索框以图搜图就能找到相同或相似款的产品并同时兼有比价的效果。
淘淘搜的前身是一家外包软件公司。外包软件市场竞争门槛低利润渐趋微薄林建聪和他的合伙人萌生退意。 2007年底林建聪来到杭州开始寻找新项目。
亿邦动力网——电子商务专业媒体
彼时 图像搜索正作为一个新兴概念进入中国。在淘淘搜之前林建聪的公司已经在图像搜索领域沉淀多年曾尝试过人脸漫画、虚拟整形和车牌识别等等。他们也曾帮助淘宝制作一款叫做试衣间的产品用户只需输入自己的照片便能体验虚拟的穿衣效果。这是一个非常酷的项目一时间吸引了大量媒体聚焦用户PV更是水涨船高。但令林建聪大跌眼镜的是在极高的PV之下转化率却始终无法提高。
“我们曾经犯过一个严重的错误那就是把自己定位为一家技术驱动型的公司。 ”事后林建聪这样反思。他希望将公司运营从技术驱动转为应用驱动。
调研之后林建聪将目光转向了搜索领域BAT这三家国内最大的互联网公司百度做搜索淘宝最大的入口也是搜索而腾讯每年投入不菲的资金用于搜索。从互联网历史来看搜索模式是最具成长能力的商业模式。由此他得出结论要做宽市场创新搜索的盘子很大创业机会很多。
在当年的淘宝上文本搜索技术非常成熟但即便如此作为淘宝最大成交类目的服装服饰仍然充斥着大量词不达意的模糊搜索。
“用户喜欢搜索2013、韩版、连衣裙、碎花、 田园这些词但实际到了商品词的描述时绝大部分用户描述不清淘宝搜索的第一屏全是密密麻麻的勾选就是为了帮助用户精准描述。所以如何让用
亿邦动力网——电子商务专业媒体
户更快更好地找到搜索结果是一个很好的课题。 ”
语言不能搞定的事情必须靠图片去解决。相比于国内已相当成熟的文本搜索林建聪试图利用图像搜索为自己构筑护城河。
视觉搜索比文本搜索难得多
然而这是一个比文本搜索难得多的课题。
“首先要对图像进行特征提取让机器知道图片里是个什么东西同时还需要让机器接受大量的训练。 ”林建聪告诉《天下网商·经理人》记者。
这一训练背后的原理是虚拟网络神经元通过模拟人的神经中枢使得机器具有视觉能力。用专业术语来表述便是机器视觉。
林建聪以一个比喻简洁地解释机器视觉一张张图片在计算机的数据库中好比一串串DNA密码每张图片都有其特定的序列当搜索引擎输入一张新的图片时后台便会进行一系列的DNA密码比对特征重叠达到一定程度相应的图片就会被认为是吻合的并按照相似度给出排序。
为了给图片的特征编码淘淘搜需要将一张张原始图片切割成非常小的像素点而不同的切割方式决定了机器最终的识别效果。这一系列技术涉及一门叫做“深度学习”的算法。
亿邦动力网——电子商务专业媒体
机器视觉是巨头涉足的领域百度为深入研究“深度学习”算法特地在苹果总部的所在地美国库比蒂诺市设立了IDL Institute ofDeep Learning研究院。研究的目的之一就是利用“深度学习”研究成果改善百度搜索引擎中的图像检索功能抢占未来的图像搜索市场。
谷歌更是在短短几年时间内陆续收购了七八家涉足图像识别的技术公司并试图以产品谷歌眼镜抢占未来的入口。
图像搜索和识别的远景堪称宏伟。麻省理工学院的科学家五年前就已经研发出能根据人的面部表情变化做出相应反应的机器人Nexi这为著名科幻电影《人工智能》里的机器小男孩在现实中的出现提供了可能。
然而 因为经历过失败对过于极客范儿的畅想林建聪始终保持着警惕。在巨头的缝隙中生存他深知淘淘搜的不易并为自己制定了一系列原则做好打持久战的准备深挖用户需求形成先发优势。
从技术驱动转向应用驱动
跟所有搜索公司一样林建聪首先要做的便是为淘淘搜建立一个数据库先导入大量网页图片再将数据库中的图片过滤和合并随后提取出所有图片的特征形成索引和序列。当用户搜索一张图片
亿邦动力网——电子商务专业媒体
时淘淘搜会根据图像的特征从数据库里调取并排序。
然而林建聪很快发现了作为一家应用驱动的技术型公司背后的困难做图像搜索的应用面对的是数以亿计的图片想要让搜索更精确必须有一些辅助手段。
与数据量级相对较小的人脸搜索相比淘淘搜所涉及的服装服饰的搜索更为困难。以衬衣为例其质量好坏与织物的密度有关但密度的高低更多要靠手感靠单纯的机器视觉无法识别。再比如搜索引擎的数据库更新都有一定的时间延迟往往会出现用户发送了搜索请求淘淘搜搜索到图片而用户点击链接到淘宝后却发现该款商品已经下架的情况。
此外跟所有图像搜索遭遇的问题类似林建聪发现商品的色彩、图案是最容易被优先识别的其材质、版型的识别则显得较为困难。
对这一系列问题淘淘搜的解决方案颇为务实。 “除了图片搜索我们还会借助文本来进行分析做出二次过滤。例如用户搜索的是一款雪地靴的图片但如果他随后输入品牌U GG搜索结果就能将不符合的图片过滤掉。 ”林建聪告诉《天下网商·经理人》记者 “十八般武艺全上技术只是其中一种手段。 ”
除了提高分析的速度外林建聪还希望通过提供尽可能多的相似
亿邦动力网——电子商务专业媒体
款来解决用户难以找到相同款的问题。 “用户搜索往往是冲着一件衣服的某一项或几项特征去的比如T恤用户看重的无非是领型和图案而连衣裙是否收腰、是否包臀这类表现曲线的设计很重要所以我们按照类目列出不同类目的特征元素建模的时候建立权重配比告诉机器哪一类的哪些权重更高一些。 ”
建模的背后是一套相似度权重的设计。
林建聪将这项调研分为理性和感性两方面理性打分单纯考察搜索结果的款式、图案、色彩与输入图片的相似度而感性打分只有0和1两项单纯地考察商品的“神似度” 。通过不断测试一点点优化搜索结果。
十八般武艺都用上的结果是淘淘搜的转化率相对其他搜索方式出奇地高。 “我们平均每个类目的搜索转化率都比单纯的文本搜索要高出30%左右。 ”林建聪说 “这证明了图片搜索比文本搜索更为便捷。 ”
因场景制作解决方案
自2012年底淘淘搜开始独立运营以来除了一部分淘宝客和广告收入 目前仍处于投入阶段。而林建聪思考最多的依然是如何满足用户需求为不同的场景提供不同的解决方案这一问题。在此之前淘淘搜PC端有官网和插件淘淘搜比价服务用户但在移动端产品
亿邦动力网——电子商务专业媒体
无疑有更大的想象空间。于是淘淘搜开发的App顺势上线完成了
“搜索引擎+网页插件+ App”的布局。
在移动端淘淘搜的Ap p “帮我找”解决这样一类问题 当你在路上遇到有人穿着一件好看的衣服却又不知道去哪里淘时只需用手机拍下照片打开“帮我找”输入图片就可以搜索购买。这样的以图搜图场景无疑比网页版的比价功能具有更大的想象力却也面临着更多复杂的情境。例如手机的性能、图片的像素、拍摄对象的姿势和背景等都会影响到最终的搜索结果。 目前林建聪仍在探索如何在这一复杂情境下快速起跑构筑起自己的图像识别护城河。
----------关于亿邦动力网----------
亿邦动力网是电子商务新闻门户秉承独立立场、专业精神、严谨态度做好电子商务新闻。
订阅亿邦动力网官方微信每日获取最新电商动态回复关键字可获取更多电商新闻。
亿邦动力网——电子商务专业媒体
亿邦动力网——电子商务专业媒体
云基yunbase怎么样?云基成立于2020年,目前主要提供高防海内外独立服务器,欢迎各类追求稳定和高防优质线路的用户。业务可选:洛杉矶CN2-GIA+高防(默认500G高防)、洛杉矶CN2-GIA(默认带50Gbps防御)、香港CN2-GIA高防(双向CN2GIA专线,突发带宽支持,15G-20G DDoS防御,无视CC)。目前,美国洛杉矶CN2-GIA高防独立服务器,8核16G,最高500G ...
diyvm怎么样?diyvm这是一家低调国人VPS主机商,成立于2009年,提供的产品包括VPS主机和独立服务器租用等,数据中心包括香港沙田、美国洛杉矶、日本大阪等,VPS主机基于XEN架构,均为国内直连线路,主机支持异地备份与自定义镜像,可提供内网IP。最近,DiyVM商家对香港机房VPS提供5折优惠码,最低2GB内存起优惠后仅需50元/月。点击进入:diyvm官方网站地址DiyVM香港机房CN...
ReliableSite怎么样?ReliableSite好不好。ReliableSite是一家成立于2006年的老牌美国商家,主要经营美国独立服务器租赁,数据中心位于:洛杉矶、迈阿密、纽约,带宽1Gbps起步,花19美元/月即可升级到10Gbps带宽,月流量150T足够各种业务场景使用,且免费提供20Gbps DDoS防护。当前商家有几款大硬盘美国独服,地点位于美国洛杉矶或纽约机房,机器配置很具有...