游戏攻略网
当前位置: 首页 游戏攻略

数据计算关键技术(时序关系网络帮助计算机填补帧之间的空白)

时间:2023-07-02 作者: 小编 阅读量: 1 栏目名: 游戏攻略

选取关键帧目前常常被用于活动识别的两种卷积神经网络模块存在效率和准确率方面的缺陷。另一种模型被称为双流卷积神经网络,它的准确率较之于前一种模型低一些,但计算效率更高。如果此时第三帧显示物体在屏幕的中间,那么这个概率还会继续增加,以此类推。研究人员指出,他们的TRN模块在某些测试中比那些关键帧模型的准确率提升了几乎一倍。接下来,研究人员的目标是提高模块的复杂程度。

雷锋网 AI 科技评论按:如果你向一个人仅仅展示一段视频中的几帧,他通常可以推测出视频里发生的是什么事件以及屏幕上会显示出什么。例如,如果我们在视频开始时的帧中看到了一堆堆叠起来的罐头,在视频中间的帧中看到了有人将手指放在了视频的底部,而在视频后面的帧中看到这堆罐头倒了,我们可以猜测出手指也许推了罐头一把。然而,计算机却很难思考出这一点。

在前段时间举行的 2018 年欧洲计算机视觉大会(ECCV2018)上,周博磊与麻省理工学院的研究人员一共提出了一个附加的视频处理模块,该模块可以帮助被人们称为卷积神经网络(CNN)的人工智能系统填补视频帧之间的空白,从而大大提升了网络的活动识别能力。 雷锋网 AI 科技评论简介如下。

机器学习系统通过仅仅在几个关键帧中观察物体如何变化从而有效地识别活动

研究人员将这个模块称为时序关系网络(TRN),它能够学习视频中的物体在不同的时间发生了怎样的变化。它通过分析一些在视频的不同阶段描绘某种活动的关键帧(例如,堆叠放置的物体被推倒。)来做到这一点。接着,它可以使用相同的过程识别一段新视频中相同类型的活动。

在实验中,该模块在识别数百种基本活动时,表现大大超过了现有的模型,这些活动就像将某些物体戳倒、将物体抛向空中,或者渐渐竖起大拇指。它还能更加准确地预测出视频中接下来会发生什么。例如,在给定少量的早期视频帧的情况下,推测出两只手在轻微地撕扯一张纸。

在未来,这个模块可以被用来帮助机器人更好地理解它们周围发生了什么。

论文第一作者、前 MIT 计算机科学和人工智能实验室(CSAIL)博士生、现任香港中文大学计算机科学专业助理教授周博磊说:「我们构建了一个人工智能系统,我们用它来识别物体的变化,而不是识别物体外观。该系统并不会对所有的帧进行处理,它会挑出关键帧,然后使用这些帧的时序关系,识别究竟发生了什么。这将提高系统的效率,使其能够准确地实时运行」。

这篇论文的联合作者是CSAIL 首席科学家 Antonio Torralba(他同时也是MIT 电子工程和计算机科学系的教授)、CSAIL 首席研究员Aude Oliva,以及CSAIL 研究助理 Alex Andonian。

选取关键帧

目前常常被用于活动识别的两种卷积神经网络模块存在效率和准确率方面的缺陷。其中第一种模型时准确的,但是在做预测之前必须逐帧对视频进行分析,这样做的计算复杂度是很大的,运行起来十分缓慢。另一种模型被称为双流卷积神经网络,它的准确率较之于前一种模型低一些,但计算效率更高。双流网络使用一个流来提取一个视频帧的特征,然后将结果与「光流」(提取出的一组关于每个像素点运动的信息流)融合在一起。提取光流的计算复杂度同样很高,所以这个模型仍然没有那么高效。

「我们想要在这两种模型(效率与准确率)之间找到一种折中的方式」。

研究人员在三个众包的进行各种各样活动的短视频数据集上训练并测试了它们的模块。第一个数据集叫做「Something-Something」,它是由TwentyBN 公司构建的,包含174 个活动类别的超过20万条短视频,比如说戳倒一个物体或举起一个物体。第二个数据集是「Jester」,它包含关于27 种不同的手势的大约15 万条视频,例如竖起大拇指或向左挥击。第三个数据集是由卡内基梅隆大学的研究人员构建的「Charades」,它包含157 个活动类别的超过1 万条短视频,比骑自行车或打篮球。

当我们拥有一个视频文件时,研究人员构建的模块每间隔一段时间同时以两帧一组、三帧一组或四帧一组处理顺序排列的帧。然后,模块会迅速分配一个概率,它代表物体在这些帧之间的变化与一个特定的活动类别相匹配的可能性。例如,如果我们要使用模块处理两个帧,其中后一帧在屏幕的底部显示了一个物体,而这个物体在前一帧中出现在屏幕顶部,该模块就会为活动「将物体向下移动」分配一个高的概率。如果此时第三帧显示物体在屏幕的中间,那么这个概率还会继续增加,以此类推。通过这种方法,该模块可以在最能代表某类活动的帧中学习对象变换的特征。

识别和预测活动

在测试中,配备了新模块的卷积神经网络使用两帧准确地识别出了许多活动,但是通过采样更多的帧,准确率还能被继续提升。对于Jester 数据集来说,模块在活动识别中达到了最高的95% 的准确率,击败了一些现有的模型。

新模块甚至在模糊分类任务「Something-Something」上也得到了正确的结果。例如,包括「假装打开一本书」和「打开一本书」之类的行动。为了将二者区分开来,该模块只是对一些关键帧进行了取样,例如,一只手在较早的帧中放在一本书旁边,而在较晚的书中则远离了这本书。

其它的一些活动识别模型也对关键帧进行处理,但是并没有考虑帧与帧之间的时序关系,这会降低它们的准确率。研究人员指出,他们的TRN 模块在某些测试中比那些关键帧模型的准确率提升了几乎一倍。

在给定的视频帧有限的情况下,该模块在预测活动方面的表现也优于其他模型。在处理了前25% 的帧之后,该模块的准确率比对比基线模型搞了几个百分点。当处理了50% 的帧之后,该模块的准确率的准确率提高了10% 到40%。例如,根据两只手在较早的帧中的位置来判断纸张是否会被撕开一点,并且预测一只向前伸出的举起的手会向下滑动。

「这对机器人应用十分重要,」周博磊说。「当你执行某种特定的动作时,你会想要一个机器人能够事先知道接下来会发生什么」。

接下来,研究人员的目标是提高模块的复杂程度。首先,他们将同时实现活动识别和物体识别。然后,他们希望引入一些「直观的物理知识」,这能够帮助该模块理解物体的实际物理性质。「因为我们知道这些视频中的许多物理学原理,我们可以训练该模块学习这些物理定律,并用它们来识别新的视频,」周博磊说。「我们也将开源所有的代码和模型。活动理解是目前人工智能领域一个令人兴奋的研究课题」。

论文地址:https://arxiv.org/abs/1711.08496

via mit.csail,雷锋网 AI 科技评论编译

    推荐阅读
  • steam棋牌游戏推荐(幸运之夜新版本亮相TGC)

    steam棋牌游戏推荐12月1日,2017腾讯游戏嘉年华正式在成都开幕,腾讯的VR社交游戏《幸运之夜》在现场发布了最新版本。VR《幸运之夜》在TGC2017上惊艳亮相《幸运之夜》新版本发布邀请好友一起游戏今年7月底,《幸运之夜》正式在Steam发布,并推出了首款游戏作品“德州扑克”。今年的TGC2017现场,《幸运之夜》全新版本便带来了对互动性方面的提升。

  • 儿童睡前故事卖火柴的小女孩大全(卖火柴的小女孩)

    在长发公主的故事里,兔子小姐变成了手持宝剑的骑士,穿过了山川和河流,战胜了地狱恶犬,最终救出了长着一头金黄色长发的熊猫先生。随着一阵空间的波动,熊猫先生和兔子小姐来到了冰天雪地的圣诞节。小女孩被这突如其来的变化惊呆了。熊猫先生没有回答,轻轻摸了摸小女孩的头。小女孩点燃了第二根火柴。熊猫先生和兔子小姐则来到壁炉前,商量起小女孩最后一个愿望。熊猫先生蹲下来,握起小女孩的手。

  • 怎样做ppr管快一点(PPR管安装方法及技巧)

    怎样做ppr管快一点PPR管安装方法及技巧首先准备好需要的材料:热熔机,小剪刀,ppr管,管件,手巾。一定要根据自己热熔ppr管的口径,准备相应的热熔头。清洁:清洁管材与管件的焊接段部位,建议用95%浓度酒精擦净。在熔接时间内迅速的将管材无旋转的垂直插入管件中,并维持5秒以上,然后按相应冷却时间冷却。热熔后做到横平竖直,美观大方。

  • 大托特包搭配技巧(大托特包搭配技巧简述)

    西装外套+托特包复古时尚的格子,由黑白交错的条纹形成,文艺而又端庄搭配撞色托特包,优雅而不失俏皮,让气场变得灵动起来内搭白色连帽卫衣,减龄又可爱,接下来我们就来聊聊关于大托特包搭配技巧?大托特包搭配技巧西装外套+托特包复古时尚的格子,由黑白交错的条纹形成,文艺而又端庄。衬衫+托特包白色的衬衫休闲慵懒,给人一种空灵的感觉以及干净纯粹的气质。

  • 刘涛电视剧口碑(电视剧景气指数第一)

    还记得3月份刘涛在和周渝民主演的《大宋宫词》中扮嫩出演少妇被很多观众吐槽。万万没想到时隔数月,刘涛带着她的新剧《星辰大海》杀回来了。目前主要的剧情线在刘涛饰演的女主简爱身上。因为小时候意外发现母亲出轨的事,得知真相的父亲激愤之下杀死母亲并自杀,简爱因此成为了一个孤女。逃出傻子家的简爱在与姑姑的争执中误伤姑姑,从此开启逃命生涯。简爱从面馆辞职走投无路,误打误撞进入大公司之后面临着同事的故意刁难。

  • 外墙装修材料有哪些 外墙装修材料有哪些类型

    外墙涂料具有装饰性良好、耐污染耐老化以及施工维修容易和价格合理的特点。一般来说釉面外墙砖有亚光面与无光面两大类。它的装饰的效果也不错,有柚木色、深灰色等等可供选择。由于它的表面的肌理很清晰,所以色泽漂亮且装饰性极强。本站,中国知名大型装修平台,装修领导品牌。

  • 世界上有哪些花(世界上有哪些花 名字)

    瓜叶菊、香豌豆、夏兰、石竹、石蒜、荷花、翠菊、睡莲、福禄考、晚香玉、万寿菊、千日红、建兰、铃兰、报岁兰、香堇、大岩桐、水仙、小草兰、瓜叶菊、蒲包花、免子花、入腊红、三色堇、百日草、鸡冠花、一串红。孔雀草、大波斯菊、金盏菊、非洲凤仙花、菊花、非洲菊、观赏凤梨类、射干、非洲紫罗兰、天堂鸟、炮竹红、菊花、康乃馨、红掌、满天星、星辰花、三角梅、虞美人。

  • 长歌行李长歌母亲是谁杀的(长歌行李长歌的简介)

    下面更多详细答案一起来看看吧!长歌行李长歌母亲是谁杀的《长歌行》李长歌母亲是自杀的。李长歌,太子李建成之女,生母则是回纥王族。父母手足均死于玄武门之变,满怀愤恨的长歌凭高超武艺逃出皇宫,并在追捕过程中制造“坠崖假死”而逃生,其后女扮男装隐瞒身份流落民间,一心只想为父母复仇,在家和国的利害冲突中,最后放弃复仇,和阿诗勒隼一起成为了民族和解的使者。

  • 什么时候喝蛋白粉增肌效果最好(什么时候喝蛋白粉增肌效果最好)

    从长远来看,这种方法被证明可以促使肌肉明显增长。如果摄入量超过一定的阈值,蛋白质的合成就会受限。如果是以乳清饮料的形式摄入乳清蛋白,运动者可以在运动结束后立即饮用。按每公斤体重1克的标准,在健身前后立即摄入以及在运动后1小时内摄入可快速吸收的碳水化合物,可以明显抑制肌肉分解,并大大促进肌肉快速和明显的增长。在这种情况下,大量分泌的胰岛素促进了氨基酸向工作中的肌肉运输,为蛋白质合成奠定基础。

  • 窦骁周冬雨山楂树之恋结局(周冬雨18岁第一次出演)

    周冬雨18岁第一次出演要说最近最火的电影,非《少年的你》莫属,上映14天,已经收获了12.45亿的票房成绩,成为现阶段最强的票房黑马而作为该片主演的周冬雨和易烊千玺,也凭借在该片中的精彩演出,演技得到大众的进一步认可作为“。