专访极链科技首席科学家姜育刚:人工智能的过去、现在和未来

时氪分享 · 2019-05-10
尽管人工智能领域频频涌现出对人工智能寒冬的担忧,但无论是企业届还是学术届,人工智能的热情只增不减。

在新一代信息技术的驱动下,中国的视频行业生态正在发生着可喜的变化。最近几年,随着网络视频的爆发,归因于此,广告市场的焦点也随之发生了重大转移,几乎完全进入到智能视频时代。市场的繁荣也促进了技术进步,在5月10日的「流量星球」发布会上,极链科技Video++首席科学家姜育刚教授做了主题为《Video AI的过去、现在和未来》的演讲,从数据、算法、算力等角度来分析打造大规模智能视频分析系统的关键要素,并分享了其对人工智能的过去、现在和未来发展的思考。

十年饮冰 难凉热血:人工智能技术的进阶

“我从2005年开始从事视频内容识别方面的算法研究,当时计算机视觉领域还远没有现在这么火热。”

视觉感知对于人类的重要性不言而喻,承载这一能力的计算机视觉技术也会对各个领域产生重要的影响。1950年科幻作家艾萨克·阿西莫夫出版了《我的机器人》短篇小说集,描绘了早期人们对机器智能的期待和想象。在过去的几十年里,人工智能几经沉浮,随着数据、算法、算力的全面提升,终于迎来了全面爆发期。

今年是姜育刚教授进入计算机视觉领域的第15个年头,时至今日,姜育刚教授早已经成为计算机视觉领域的知名学者。沉浸人工智能领域十几年,姜教授在视频智能处理领域做出了很多重要贡献,而最初进入该领域,他也是花费了很长的时间进行摸索与探究,他回忆道:“当年在香港,导师给的第一个任务就是参加美国国家标准局主办的TRECVID视频评测比赛,第一次只拿了前十名的成绩,后来经过很长时间的摸索,和卡耐基梅隆大学以及哥伦比亚大学交流合作,2008年和2010年两次拿到了第一名。回想起来,我觉得自己很幸运,当年选择了一个自己喜欢的方向,遇到了很好的导师和合作者,这么多年从来没有放弃过,一直在视频分析领域深入钻研,在评测数据集构建、核心算法研发以及成果应用几个方面都做了一些有意义的工作。”

自1956年“人工智能”这一词的诞生,我国在短短数十年中已经步入了高速发展的轨道。2017年国务院印发《新一代人工智能发展规划》,人工智能正式上升为国家战略,这是中国首个面向2030年的人工智能发展规划。但是,现在人工智能技术面临的应用场景落地方面的挑战很大程度上还是因为底层技术不够成熟,例如,已有的技术对一些较小的物体识别不够精准,深度学习在训练过程中依然需要大量标注数据等等。

慎终如始 则无败事:深度学习带来的新关注

“我很看好智能视频分析技术的产业应用前景,与Video++团队一起,我们可以完成很多之前大家想做而没有精力或资源去做的事情。”

《科学革命的结构》里面曾提到了典范转移的概念。量子力学从经典力学转变而来,日心说取代地心说,这些都是个重大的典范转移,意味着我们又要从零开始,只不过是在一个非常高的层次上重新开始。

计算机视觉领域经历50多年的发展,到今天为止,在深度学习技术的推动下已经取得了长足进步,可以在一些应用领域达到实用水平,甚至在一些场景下已经超越了人类。而技术逐渐在应用领域达到实用水平,也是计算机视觉领域不断吸引大企业不断投入和创业公司不断涌入的重要原因。

当前,国内外科技企业以及领域内的研究学者都在积极地推动人工智能技术的研发落地,人脸识别、消费及安防视频事件识别、语音识别等一系列技术逐渐走向成熟,但仔细算来,目前计算机视觉领域的真正大规模成熟应用还屈指可数。智能视频分析技术在国外已经有多年的发展与应用,目前主要应用于公共安全相关系统、文化娱乐、智能交通等相关领域。而对于当前的发展,作为计算机视觉领域的专家,姜育刚教授向我们表示很看好人工智能技术在消费视频产业的应用前景,并选择加入与其关注问题高度匹配的极链科技Video++。

姜育刚教授介绍道:“极链科技Video++是一家聚焦在‘AI+视频’领域的科技公司,Video++的人工智能研究院还处在加速建设的阶段,目前拥有多位研究人员,创始团队由来自中国科学院、复旦大学、加拿大皇后大学等世界名校的专家及博士组成。深耕计算机视觉领域相关技术的研发,主要研究方向包括:视频内容识别、视频分类、视频剪辑与摘要、视频检索、视频自动生成、视频情感分析、视频风格迁移、深度神经网络的压缩与加速等,致力于视频AI技术的研发积累、前沿探索以及成果应用落地转化。”

谈及接下来的工作计划,姜育刚教授表示“在深入分析了现有技术的局限后,我们今年开始正在构建一个Video-Net数据集,目标是在同一批视频数据上涵盖尽量多的视频语义类别,在此基础上我们可以深入研究新的算法,通过挖掘视频语义的关联关系,提升视频内容识别精度,而对语义关系缺乏挖掘和利用正是当前面向视频的深度学习技术的一个较大局限。以小物体的识别为例,任何物体都是在一定场景的约束下出现,通过对场景内很多比较大的物体的理解,对识别某特定小物体就会有较大帮助。

Video-Net全面涵盖视频中常见的事件、动作、物体、场景等类别,在标签种类完备程度方面大幅超越现有的公开数据,我们希望它能极大推动视频行业的核心算法研发、评测与应用。基于Video-Net,我们今年秋季将主办第一届大规模视频识别挑战赛,预期将有来自全球的多支队伍参赛,展开激烈角逐,大力推动相关技术进步。除了Video-Net比赛外,今年我们也会积极对外参与一些竞赛,团队去年在谷歌地标识别大赛中获得全球第一名的出色成绩。不过,现阶段主要精力还是聚焦在核心技术和产品的打磨上。”

除此之外,姜育刚教授作为复旦大学计算机学院的知名教授,正在努力为复旦与Video++牵线搭桥,借力复旦强大的科研实力,实现更快的发展。目前双方已经确定在智能视频技术领域开展长期合作,成立校级联合研究中心,聚焦视频内容识别、检索、推荐等关键方向,合作开展创新研究。研究中心主要关注前沿方法和技术,预期成果包括论文、专利等等,好的成果会通过公司的工程团队进行产品化,打通产学研一体化的通道,为学术界带来更多新方法,也为产业界带来更多新技术、新应用、新体验。

博观而约取 厚积而薄发:计算机视觉的发展态势

“我们已经深刻感受到了技术带来的影响和变化,任何行业都不会永远‘热’下去,但是从技术发展以及社会需求的角度冷静去看,技术与社会持续进步的大方向永远不会变。”

1973年,拉特希尔向英国政府提交了一份关于人工智能的研究报告,对当时的机器人技术、语言处理技术和图像识别技术进行了严厉的批评,尖锐的指出人工智能那些看上去宏伟的目标根本无法实现,研究已经完全失败后,科学界对人工智能进行了一轮深入的拷问,AI的遭受到严厉的批评和对其实际价值的质疑。随后,各国政府和机构也停止或减少了资金投入,人工智能在70年代陷入了第一次寒冬。

针对当下依然有人认为编写计算机视觉程序很容易,这些误会常常对产业的发展产生不利的影响,记者带着这样的疑问询问姜教授,姜教授带着科学家们一贯的严谨态度道:“以前大家觉得计算机视觉难度低可能是从人自身的感知角度去思考的,觉得大部分视觉识别问题对人来讲都很容易。事实上,计算机视觉,尤其是高层次计算机视觉问题(High-level Computer Vision),难就难在计算机与人理解问题的差别上,我们通常称为“语义鸿沟”。图像、视频给计算机去看,只能看到一堆的数字,也就是每个像素的值,而人能轻松理解其中的语义内容。我们非常多的同行努力多年,就是要跨越这个“语义鸿沟”,让计算机能像人一样理解图像、视频中的语义,同时利用计算机的优点,可能会理解的更快,也就是可以高效的处理很多的数据。经过这么多年的研究,技术取得了极大的进步,这几年公众也可以陆续看到很多报道,说人工智能算法在某些问题上超过人。我想在计算机视觉问题上,大部分研究人员还是有十分清醒的认识的,虽然在部分问题上效果很好,机器真正全方位的超过人,还有很长的路要走。”

《权力的游戏》中史塔克家族世代相传的族语“凛冬将至”,显得格外谨慎,以冰原狼为族徽的他们要时刻提防着绝境长城外的妖魔鬼怪。尽管人工智能领域频频涌现“人工智能寒冬”的担忧,但在这种背景下,计算机视觉依然成为了国内外科技巨头的重点发力研究领域,以及创业公司的重要切入口。人工智能经历的几次凛冬,使企业家和业内人士对计算机视觉的发展格外谨慎。目前业界仅有几家AI+视频的企业,未来这些企业的转型或者升级将成为大家关注的新领域。与海外市场、高校和产业界合作,也对国内计算机视觉的发展起到颠覆式的作用。

目前计算机视觉顶级会议的接收论文中,华人学者占比已经非常高。相对而言美国在基础研究领域做出了更多的优秀成果,也吸引了更多的人才,但中国在应用方面则更活跃,比美国拥有更大的市场,更多的数据和更宽容的政策,越来越多的互联网公司在这一大环境下积极地推动计算机视觉领域的突破和前进。相信在计算机视觉技术的持续进步下,人们也会越来越多的感受到技术带来的极大便利。

专访极链科技首席科学家姜育刚:人工智能的过去、现在和未来

极链科技Video++首席科学家姜育刚教授

极链科技Video++首席科学家姜育刚教授

多媒体及计算机视觉领域知名学者,香港城市大学博士,美国哥伦比亚大学博士后,复旦大学计算机科学技术学院教授、博士生导师、上海视频技术与系统工程研究中心主任,国家优秀青年科学基金获得者,国家万人计划青年拔尖人才,教育部青年长江学者。长期从事多媒体信息处理、计算机视觉与深度学习研究,主要关注视频大数据内容识别与检索方法,至今在国际知名期刊和会议上发表论文百余篇,包括IEEE TPAMI、CVPR、ICCV、ACM MM、ECCV等,并先后于微软亚洲研究院、英特尔中国研究院、腾讯人工智能实验室做短期访问。研发的多个智能视频系统成功部署在国家关键地点的重大任务中,以第一完成人获上海市科技进步一等奖等多项奖励和荣誉。

+1

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

下一篇

相同营收压力之下,各家有不同的应对方式。

2019-05-10

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

为你推送和解读最前沿、最有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚集全球最优秀的创业者,项目融资率接近97%,领跑行业