动作谷歌sb

谷歌sb  时间:2021-05-21  阅读:()
Google发布AVA:一个用于理解人类动作的精细标记视频数据集原创:Google谷歌开发者2017-11-03文/Google软件工程师ChunhuiGu和DavidRoss教机器理解视频中的人类动作是计算机视觉的一个基本研究课题,对于个人视频搜索和发现、运动分析和手势接口等应用必不可少.
过去几年来,在图像中分类和查找对象取得了令人兴奋的突破,但识别人类动作仍然是一个巨大的挑战.
原因在于,就其本性而言,人类动作的定义不如视频对象完善,因此,很难构建精细标记的动作视频数据集.
尽管有许多基准数据集(如UCF101、ActivityNet和DeepMind的Kinetics)采用图像分类标记模式,并为数据集中的每个视频或视频剪辑分配一个标签,但对于有多人执行不同动作的复杂场景,还没有相应的数据集.
为促进对人类动作识别的进一步研究,我们发布了AVA,它诞生于"原子视觉动作",是一个全新的数据集,为扩展视频序列中的每个人提供多个动作标签.
AVA由YouTube中公开视频的网址组成,注解了一组80种时空局部化的原子动作(如"走"、"踢(物体)"、"握手"等),产生了5.
76万个视频片段、9.
6万个标记动作执行人以及总共21万个动作标签.
您可以浏览网站,了解数据集和下载注解:https://research.
google.
com/ava并阅读我们的arXiv论文,了解数据集的设计和开发:https://arxiv.
org/abs/1705.
08421与其他动作数据集相比,AVA具有以下重要特征:以人为中心的注解.
每个动作标签与人相关,而不是与视频或剪辑相关.
因此,我们可以将不同标签分配到同一场景中执行不同动作的多个人(这种情况很常见).
原子视觉动作.
我们将动作标签限于很小的时间尺度(3秒),在此范围内,动作的性质是身体活动,具有清晰的视觉特征.
现实视频材料.
我们使用电影作为AVA的来源,从很多不同的流派和原产国取材.
因此,数据中包含广泛的人类行为.
3秒视频片段(来自视频来源)示例,其边界框注解在每个片段的中间帧中.
(为清楚起见,每个示例只显示一个边界框)为创建AVA,我们先从YouTube收集了一组变化多的长形式内容,集中于"电影"和"电视"类别,有许多不同国籍的专业演员.
我们对每个视频分析了15分钟的片段,将其统一分隔为300个不重叠的3秒片段.
采样策略将动作序列保持在连贯的时间背景中.
然后,我们手动标识每个3秒片段中间帧中所有人的边界框.
对于边界框中的每个人,注解人员从预定义的原子动作词汇(有80个类别)中选择不同数量的标签来描述个人在片段中的动作.
这些动作分为三组:姿势/移动、人-物体互动以及人-人互动.
因为我们详尽标记了执行全部动作的所有人,所以,AVA标签的频率遵循长尾分布,下面进行了简要介绍.
AVA原子动作标签的分布.
X轴中显示的标签只是我们词汇的一部分.
AVA的独特设计可让我们推导出其他现有数据集中没有的一些有趣统计信息.
例如,如果很多人至少有两个标签,我们便可测量动作标签的共现模式.
下图所示为AVA中最常见的共现动作对及其共现得分.
我们确认预期模式,比如人们经常在唱歌时弹奏乐器,跟小孩玩时把人举起,以及在亲吻时拥抱,等等.
AVA中最常见的共现动作对.
为评估AVA数据集中人类动作识别系统的有效性,我们实现了现有基线深度学习模型,该模型可以从更小的JHMDB数据集获得更好的性能.
由于缩放、背景杂波、摄影和外观变化等富有挑战性的变化,此模型在正确识别AVA中的动作时表现一般(18.
4%mAP).
这表明AVA是一个有用的试验台,可用于为未来几年开发和评估新的动作识别架构和算法.
我们希望,AVA能帮助改进人类动作识别系统的开发,能基于精细时空粒度的标签在个人动作层级为复杂活动建模.
我们将继续扩展和改进AVA,也渴望听到社区的反馈意见,帮助我们指引未来的方向.
致谢AVA的核心团队包括ChunhuiGu、ChenSun、DavidRoss、CarolinePantofaru、YeqingLi、SudheendraVijayanarasimhan、GeorgeToderici、SusannaRicco、RahulSukthankar、CordeliaSchmid和JitendraMalik.
感谢许多Google同事和注解人员对此项目的全力支持.

TTcloud(月$70)E3-1270V3 8GB内存 10Mbps带宽 ,日本独立服务器

关于TTCLOUD服务商在今年初的时候有介绍过一次,而且对于他们家的美国圣何塞服务器有过简单的测评,这个服务商主要是提供独立服务器业务的。目前托管硬件已经达到5000台服务器或节点,主要经营圣何塞,洛杉矶以及日本东京三个地区的数据中心业务。这次看到商家有推出了新上架的日本独立服务器促销活动,价格 $70/月起,季付送10Mbps带宽。也可以跟进客户的需求进行各种DIY定制。内存CPU硬盘流量带宽价...

NameCheap黑色星期五和网络礼拜一

如果我们较早关注NameCheap商家的朋友应该记得前几年商家黑色星期五和网络星期一的时候大促采用的闪购活动,每一个小时轮番变化一次促销活动而且限量的。那时候会导致拥挤官网打不开迟缓的问题。从去年开始,包括今年,NameCheap商家比较直接的告诉你黑色星期五和网络星期一为期6天的活动。没有给你限量的活动,只有限时六天,这个是到11月29日。如果我们有需要新注册、转入域名的可以参加,优惠力度还是比...

VPSDime7美元/月,美国达拉斯Windows VPS,2核4G/50GB SSD/2TB流量/Hyper-V虚拟化

VPSDime是2013年成立的国外VPS主机商,以大内存闻名业界,主营基于OpenVZ和KVM虚拟化的Linux套餐,大内存、10Gbps大带宽、大硬盘,有美国西雅图、达拉斯、新泽西、英国、荷兰机房可选。在上个月搞了一款达拉斯Linux系统VPS促销,详情查看:VPSDime夏季促销:美国达拉斯VPS/2G内存/2核/20gSSD/1T流量/$20/年,此次推出一款Windows VPS,依然是...

谷歌sb为你推荐
扭矩ios10状态微信5深圳做网站-确认收货手太快网店发来空箱子产业2014年2月25日developedandroid支持ipadms17-010win10蒙林北冬虫夏草酒·10年原浆1*6 500ml 176,176是一瓶的价格还是一箱的价格迅雷快鸟迅雷快鸟支持移动宽带提速吗迅雷快鸟迅雷快鸟是做什么用的,,,www.baidu.jp日本视频怎样看
域名是什么 备案未注册域名 什么是域名地址 本网站服务器在美国维护 permitrootlogin shopex空间 工信部icp备案号 工信部icp备案查询 群英网络 阿里云个人邮箱 googlevoice 新网dns 美国主机 weblogic部署 ftp是什么东西 傲盾代理 游戏服务器 paypal登陆 rewrite规则 主机箱 更多