您好!欢迎访问芭乐app下载安装!
专注精密制造10载以上
专业点胶阀喷嘴,撞针,精密机械零件加工厂家
联系方式
陈小姐:13899999999
周先生:13988888888
您当前的位置: 主页 > 新闻动态 > 常见问题 >

常见问题

AI管理个人视频,分享快乐是否更简单?

更新时间  2021-04-16 00:32 阅读
本文摘要:记录:【照片来源:谷歌Blog所有者:Sudhendravijayanaravidravijayanaravidravidravidravidravidravidran】现在人们可以通过录像和朋友和恋人分享美好的时间,这已经是什么新鲜事了。但是,享受大量视频素材的人,反复所有完整的视频素材,寻找稍微温暖一点,或者适合和家人朋友共享的终极视频片段,是非常耗时的工作。

芭乐app下载官网入口

记录:【照片来源:谷歌Blog所有者:Sudhendravijayanaravidravijayanaravidravidravidravidravidravidran】现在人们可以通过录像和朋友和恋人分享美好的时间,这已经是什么新鲜事了。但是,享受大量视频素材的人,反复所有完整的视频素材,寻找稍微温暖一点,或者适合和家人朋友共享的终极视频片段,是非常耗时的工作。

谷歌的照片不会自动在录像中寻找具有纪念意义的画面,制作动画,所以孩子吹灭蜡烛的瞬间,朋友跳进游泳池的瞬间,这样的画面可以慢慢狩猎。这样,和朋友和家人分享感人的瞬间就更容易了。

反复研究作为时序动作定位(TAL)的R-CNN结构后,自动化问题解决了。这些难题的棘手之处从千万种排名不同的数据中识别和分类。

因此,我们创建了TALNet,可以在一定时间内识别大量的暂时动作。目前,与其他方法相比,TALNet完成这项任务的使用时间最短。

还允许Google图片推荐视频最佳画面,让好友分享。记录:【图像来源:谷歌Blog所有者:SudhendraVijayanaravinaraviravinaravidross,第一步是集合人们可能想要的动作,如吹灭日蜡烛、猫摇晃巴等。然后,我们将对这些具有特定动作的视频片段进行评论,以建立一个大型的培训数据库。

之后,我们不会拒绝审查员找到并标记所有时间。最后,模型通过这个带注释的数据集训练,可以在新的视频中识别所需的瞬间。识别这些动作属于计算机视觉领域,与生活中罕见的对象识别相同,属于视觉检查的范畴。

但是,TAL的目的是在冗长而没有遮荫的视频中,标记每个动作的开始和结束时间,在不同的动作上贴上标签(如吹蜡烛)。更注重在一维视频帧序列中狩猎包括动作的时间段。我们使用的TALNet方法是R-CNN二维图像对象检测框架的灵感。因此,要解读TALNet,首先要解读R-CNN。

右图为R-CNN于R-CNN结构的对象检查。记录:【图像来源:GoogleBlog所有者:Sudheendravijayanaravidravidross)第一步是分解对象推荐,分类图像对象。

在此之前,通过卷积神经网络(CNN)将输出图像切换为二维特征图。然后,对方推荐网络围绕候选人分解围板。这些框架通过多个尺度分解来应对自然图像中对象大小的不确定性。

对象确认后,用于深度神经网络(DNN)将界面板中的对象分类为特定对象,如人、自行车等。时序动作定位是以类似R-CNN的方式完成的。首先,将视频输出帧序列切换为编码场景的一维特征同构序列。该组织被发送到视频段推荐网络,该网络分解候补段,每个候补段从开始和结束时间定义。

芭乐app下载官网入口

然后,DNN分类视频片段的动作,如灌篮和传球。记录:【图像来源:GoogleBlog所有者:SudhendraVijayanaravidravidravidraviravijayanaranaravidrosse】时序动作定位可视为对象检查的一维对应物,但处理动作定位有值得注意的问题。为了将R-CNN方法应用到动作定位领域,我们特意解决了三个问题,新设计了系统结构,专门解决了问题。

1、动作在续航时间方面变量更大;动作续航时间范围变化更大,可以从几秒到几分钟平均。对于长时间的动作,解读动作的各个框架并不重要。无视,可以通过缓慢的网页视频,更好地处理扩展的时间卷积。

芭乐app下载官网入口

该方法允许TALNet搜索视频中的动作,并根据既定的膨胀率跳过交错帧。根据锚的长度自动选择不同速度的视频展开分析,可以有效地识别整个视频和短到1秒的动作。2.目标动作前后的内容最重要的目标动作前后的内容包括定位和分类的重要信息,这里不是空间前后,而是时间前后。

因此,我们在时间内容上开展编码,方法是在引荐拆卸和分类拆卸阶段,将目标段在时间前后按一定比例扩展。3.目标动作需要多模式输出目标动作由外观、运动轨迹、音频信息定义。

因此,为了取得最佳的结果,考虑特征的多种形式是最重要的。我们对推荐拆解网和分类网都用于后期融合方案,其中每个模式都有分开的推荐拆解网,这些网的输入者可以一起获得最后的推荐。这些推荐用于分类的分类网络对各种模式进行分类,通过综合平均值得到最后的预测。

由于这些改进,THUMOS的14检测标准显示了TALNet在动作推荐和行动定位方面最佳,在ActivityNet项目中显示了竞争力。现在,每次把录像留在谷歌的照片里,模型都不会开始识别这些录像,制作动画共享。我们不断完善,用于更好的数据、特性和模型,提高动作定位的精度。

时序动作定位的改进可以推动视频亮点、视频摘要、视频搜索等众多最重要功能的进展。我们希望在提高这个领域的技术水平的同时,为人们获得更多的回忆方法。(公共编号:)记录:本文编译器来自谷歌AIBlog【封面照片来源:网站名谷歌AIBlog,所有者:Sudhedravijayanarasimhand,Davidross】版权文章允许禁止发表。

下一篇文章发表了注意事项。


本文关键词:管理,个人,视频,分享,快乐,是否,更简单,记录,芭乐app下载安装

本文来源:芭乐app下载安装-www.top-zakaz.com