算法看国外视频直播vps

看国外视频直播vps 时间:2021-01-01 阅读:()

袁勇湖北|男北京市海淀区150-2955-xxxxwillard.
yuan@gmail.
com个人博客:yongyuan.
name/bloggithub:willard-yuan(1.
4kfollowers)教育背景2013.
9-2016.
6硕士学位,中国科学院大学,信号与信息专业,保研.
2009.
9-2013.
6学士学位,西安电子科技大学,电子信息科学与技术专业,专业top3%.
工作经历快手MMU视觉算法工程师短、长视频和图像检索、查重与拷贝检测,6年视觉检索经历,掌握了若干工业视觉检索系统线上主流算法.
2018.
12-2019.
8智能配乐推荐,视频搜索,基于视频内容推荐最相关的候选音乐.
文本搜视频.
点击模型.
负责视频搜索中的点击模型与点击调权,核心指标提升XX%.
以视频检索为核心技术,为智能配乐增加相似(热歌)召回源以及原生召回源,增加精排序模型.
相似(热歌)召回源AB实验召回效果优于或可比其他召回源;精排序模型AB实验相比base排序提升2pp左右,相似(热歌)召回源以及原生召回源线上已推全.
索引算法升级.
以DNN及深度度量学习为基础,开发了一套基于SpreadingVector的特征索引算法,相比线上算法,离线评估额外增加扎汇率9.
8pp(填平与Faiss差5pp的距离,并在此基础上增加了4.
8pp),线上评估新增查重独立召回2.
7%左右,最大时延由190ms降低到110ms左右.
长视频查重优化.
从关键帧检测算法等方面,对长视频查重进行重点优化,优化后Recall@10相比优化前,在业务反馈的badcase上,召回率提升了16%左右.
负向与安全项目.
从0到1新增政治海报查重自动检测算法.
平均每日召回约6万左右,准确率在90%+;负向直播截屏优化,第1期优化召回率提升12.
5%,第2期优化离线评估新增检测召回3.
1%左右;logo检测类别接近1000种,准确率维持在99.
9%以上,热门页logo维持在万分位以下.
商品识别与检索.
负责拍照购项目,覆盖28个大类商品的检测与检索,商品识别准确率提升XXX%.
中台业务需求.
为业务提供主体检测算法、关键帧检测算法、短视频去水印算法、游戏识别算法、主色调提取算法等.

2018.
01-2018.
12第三代视频原创保护系统,对百亿级短视频(千亿级视频帧)进行第三代算法升级,同时拓展至长视频原创保护,个人绩效S.
特征升级为simNet和dupNet.
带领同事设计并研发了一种统一视觉近似重复和语义相似的特征学习框架.
在此基础上分别获得了专门面向视频查重的dupNet特征和既可以面向视频查重又可以面向语义相似的simNet特征,7000万离线数据集上评估,在暴力搜索的条件下,simNet比线上第二代特征top@10召回率提升了14.
5%,dupNet在100万离线数据集上评估,相比simNet在top@10召回率高8%左右,上线后平均每日新增召回25000左右,dupNet上线应用于A站长视频原创保护.
索引升级.
带领同事设计并研发了一种结合图ANN和OPQ的索引算法hnswOPQ.
保持了OPQ特征高压缩比、索引动态增删灵活的特征,同时引入先进的图索引技术,保证获得比OPQ更高的召回率,在1亿128维业务数据集上测试,以暴力搜索结果作为基准,top@50召回率提升由61%左右提升至82%左右.
局部特征检索系统.
从0到1构建了一套局部特征检索系统,在公开数据集ROxford数据集上MAP为XXX,应用于安全、政治违禁等查重检测上.
基于LBS视觉检索同城热点事件感知与发现.
以视频检索技术为基础,结合LBS信息构建Graph聚合相似视频.
平均每日向同城输出150个可用的热点,上线后,漫游页的dau从原来的40w50w提升至目前的240w左右;为天象平台开发地方热点、城市热点、站外魔表发现、灾害监测自动发现算法.

袁勇个人简历MacVersion最后一次更新于:December21,20202016.
12-2017.
12第二代短视频原创保护系统,对从0到1的短视频原创保护系统进行算法升级,以适应百亿级短视频原创保护,个人绩效S.
特征索引.
设计并研发了一种基于OPQ特征量化编码的视频多帧索引及排序方法,全量索引平台xx亿视频量,与视频多帧倒排结构相比,检索召回提升4倍以上,全量上相似查重独立覆盖由2%提升至5.
3%左右,线上每周收到的basecase显著减少.
校验算法.
设计并研发了一种基于CNN特征和局部特征匹配相结合的视频查重多帧校验方法,提高了视频查重校验对错帧、镜像等编辑的鲁棒性;开发了一种基于GIST全局特征更严格的图像校验方法,弥补局部特征校验的召回以及适配游戏查重校验等高度相似的场景.
重排算法.
设计并开发了一种视频(多帧)相似重排方法,上线并显著改善了相似查重的视频查重效果.

特征表达.
设计基于CNN和传统特征融合的视觉检索系统,解决实例检索问题,OxfordBuilding数据集mAP取得80%.
视频物体检测,视频Logo检测游戏识别等.
设计并开发了两种Logo识别算法,分别为:基于OCR文字识别的Logo识别算法,基于FasterRCNN结合BoVW模型以及局部特征校验的Logo识别算法,升级了并维护基于局部特征匹配Logo识别系统.
检测准确率:99.
5+%,Logo检测类别达xxx+多种,Logo每日召回占视频上传总量xxx%.
设计并开发了尺寸极小(目标尺寸<=xxx)且目标极不明显的Logo检测方法;开发了王者荣耀英雄、视频截屏、直播游戏(xxx种)等识别算法,检测准确率100%.
为嗨声、珍珠港、kwaigo等提供自动去水印需求.
美团算法工程师2016.
7-2016.
12美团,外卖风控部,算法开发.
设计开发了新的商户抓取策略,维护、优化已有的商户抓取逻辑,对新美大外卖业务的数据做日常的分析、监控及报表.

ETRACK学生初创团队算法工程师2015.
10-2016.
6ETRACK眼控技术,学生创业团队,算法设计与开发.
负责设计瞳孔检测与瞳孔中心检测算法并用C++实现,采用OpenMP实现多线程实时处理.
负责设计瞳孔中心到屏幕坐标的映射方法并用C++实现,通过安卓NDK供JAVA调用.
负责桌面版本的开发,使用QT框架构建图形界面,人眼检测算法核心部分:视频演示.
科研经历中科院西安光学精密机械研究所(2013–2016)2013.
3-2016.
6基于内容的图像检索(CBIR),课题研究方向.
熟练掌握BoW、VLAD、FV等特征编码方法,精通CBIR及大规模索引技术.
掌握并积累机器学习中常用的降维、聚类、分类以及图像物体识别技术.

提出并发表一种基于稀疏表达的哈希编码方法,详见HABIR工具包主页.
对同款物体的检索有较多的积累经验(衣服、鞋子等大型图像库30万);有对特定类图像诸如皮革、纺织图像等进行检索的经历;在13万量级的图库上做过广告logo的搜索.
对人脸数据检索与识别、医学影像检索有相应的经历,并对深度学习(CNN卷积神经网络)具备一定的理解.
2015.
1-2015.
4基于卷积神经网络的CBIR演示原型系统PicSearch,兴趣驱动型项目,协作开发.
PicSearch是一个在线图像检索原型系统,使用了CNN卷积网络模型.
线下完成图像特征的提取,并做了一定的降维处理,后台在线特征匹配与排序用python实现,服务器采用了python轻量级web开发框架CherryPy,采用Boostrap框架优化前端交互界面.
图库为包含29780张图片的Caltech-256公开数据集,采用特征常驻内存的方式进行了代码的优化,使其能及时地响应用户的查询请求(毫秒级),在线演示地址PicSearch:search.
yongyuan.
name(已下线),本地演示效果:演示视频.
2015.
3-2015.
7基于词袋模型的物体检索原型DupSearch系统,兴趣驱动型项目,独立开发.
DupSearch是一个针对ObjectRetrieval或DuplicateSearch而写的图像检索原型系统.
在OxfordBuilding公开数据库上平均检索精度达到83.
35%,对于光照、旋转、视角等具有较好的适应性,在线匹配在服务器上能较快的响应查询,并且在不复杂化现有模型情况下仍有改进提高MAP的空间.
图像库测试规模30万,取得了很不错的检索效果,算法原型系统已售予某公司,15万衣服库检索示例详见GitHub,此外,对于广告logo的搜索也能取得很高的检索精度.
袁勇个人简历MacVersion最后一次更新于:December21,20202014.
7-2015.
5复杂低空飞行的自主避险理论与方法研究(973),项目参与者.
多源协同感知周围环境,对复杂低空环境中可能的危险障碍物进行实时检测,并完成飞行器的自主避险.

负责可见光传感器数据与激光雷达传感器点云数据的融合,消除高压线检测时的误检.

负责桥梁、高压线塔、作为异常目标入侵的滑翔机等危险障碍物的实时检测.

采用opencv、dlib等计算机视觉开源库,非电力线类障碍物检测采用HOG+SVM物体检测方法.
出版物2016.
1XuelongLi,YongYuanandXiaoqiangLu,LatentSemanticMinimalHashingforImageRetrieval.
IEEETIP,2016(MINORREVISION),project.
2014.
4YongYuan,XiaoqiangLu,andXuelongLi.
LearningHashFunctionsUsingSparseReconstruction.
ACMICIMCS,pp.
14-18,2014(BestPaperRunner-upAward).
2014.
6朱文涛,袁勇.
Python计算机视觉编程(译作),图灵出版社,2014.
2015.
10李学龙,卢孝强,袁勇.
一种基于潜在语义最小哈希的图像检索方法(CN106033426A,专利).
开源项目2017.
7-Now构建CBIR领域传统特征与深度学习方法做图像检索的对比框架,详见GitHub.
2016.
8-2016.
9以SeetaFaceEngine为基础,使用LSH索引技术构建了一个人脸检索系统,详见GitHub.
2015.
4-2016.
4基于MatConvNet以及VGGNet卷积神经网络模型构建的一个用于图像检索的实验工具包,详见GitHub.
2013.
2-2016.
6实现并整理了一些流行的哈希算法及多种指标评价,目前该Matlab工具包已更新至V2.
0,详见GitHub.
2013.
12-2014.
6翻译《ProgrammingComputerVisionwithPython》时,为使读者更易于理解书中的内容,重新对书上的代码做了整理,并放在github上,详见项目主页.
2014.
2-2014.
5基于稀疏重构的哈希编码方法的Matlab代码及检索指标评价,详见GitHub.
IT技能编程语言会C++/C、OpenCV以及QT,熟练Python,Matlab,SQL,熟悉HTML,CSS,Spark算法技能精通CBIR(5年经历),熟练掌握深度学习与常见物体检测方法,对传统算法具备较好的理解常用工具OSX、Linux、Caffe、OpenCV、Vim、Xcode、Dlib、IpythonNotebook、GitGitHubgithub.
com/willard-yuan奖项中科院三好学生(2016.
4)BestPaperRunner-upAward(2014.
7)优秀学生巡回报告团成员(2012.
12)国家奖学金(2012.
11)校内一等奖学金(2011.
11)国家励志奖学金(2010.
11)语言英语CET-6和CET-4,具备专业英文文献阅读、写作及翻译能力,平时会保持对CVPR等论文的阅读.
其他喜欢编码,热爱开源,有写博客进行总结的习惯;具备较好的沟通、协调和组织能力.