视频制作的终结者?智影要做视频领域的AlphaGo

36氪 显示图片

不久,会写文章的人就能制作视频。

据CNNIC报告显示,截至2014年6月,中国网络视频用户规模达4.39亿,手机视频用户规模为2.94亿。杭州氪空间入驻项目慧川智能(hunch.ai)的CEO康洪文认为,传统图文媒体正在进入转型,切入短视频的市场。短视频市场,目前处于井喷状态,消费人数从2015年到2016年底涨了一倍以上。另外自媒体及各类门户也有这样的需求,以微信公众号为例,每天超过280万的活跃自媒体号输出超过100万篇的文章,其中67%以上适合转化为视频形式传播。根据微信公众号平台微小宝提供的数据,目前微信公众号视频的覆盖率仅在13%,且上述内容不足全网信息内容总量的10%。这里面有巨大的上升空间亟待填补。

针对上述市场,慧川智能打造的智影(ZenVideo.cn)云平台能够帮助快速生成短视频,用户只需要输入脚本文字,就可以直接通过云端生成相应的视频内容,自动配音,并且用户可以在线进行编辑和修改,如调整素材片段启止点位置、增加转场特效、镜头缩放或配音等。 预览、渲染、视频文件导出和下载等全部在平台云端完成。 

简单的来看,智影就像自带素材库且操作更简单的云端版Premiere,大大降低生产视频内容的门槛和减少所需重复劳动,AI处理的成本仅为人工处理的千分之三,而速度则是人工的40倍,以生产1分钟视频为例,资深视频剪辑师需要花费2-4小时,而通过智影系统,即使算上人工调整的时间也只需要3-5分钟。

视频制作的终结者?智影要做视频领域的AlphaGo

操作界面图

从模式上看,平台目前主要提供2B服务,客户包括卫视、门户网站、及各类自媒体及所有有视频剪辑需求的人。此外,智影丰富的剪辑师资源还能为客户提供一站式从端到端的视频剪辑及制作服务。

目前,智影基础功能全部免费。团队希望创造中国第一个在线的智能视频制作平台,并依靠中国视频市场的红利期做到全世界最大的视频制作平台。团队每个成员在计算机视觉、自然语言处理、图像视频分析、大规模并行计算等方面均有超过10年的技术积累。基于此未来公司将会逐步拓展更多功能及业务,但是现阶段的主要任务还是增加数据和用户数量。

康洪文解释,智影的技术主要包含三方面,计算机视觉、信息检索&NLP和大规模云计算。而上述三种技术的发展已经达到了商业化的要求,团队技术上的领先,确保了算法、模型和程序设计等技术上的先发优势,当商业运作之后,形成数据闭环,又拥有更多的数据和更精准的效果,进一步加深护城河。

就竞争而言,康洪文认为,目前国内如爱剪辑、绘声绘影等更多还是PC端的软件应用,也无法实现人工智能化。 国外的在线剪辑系统Wochit,被梨视频App后台使用,从一方面应证了智影系统的市场价值。但他们切入的更多是新闻市场,在人工智能技术上和智影毫无可比性,且进入中国本土化过程中并没有优势。

慧川智能创始团队来自于计算机世界排名第一的卡内基梅隆大学,以及有中国人工智能黄埔军校之称的微软研究院,谷歌。创始人康洪文,卡内基梅隆大学博士,曾在微软研究院工作,主要研究方向为人工智能及视频理解;CTO黄健,宾州州立大学博士,曾在微软研究院和Google工作,主要研究方向是NLP和机器学习;首席架构师,刘曦,卡内基梅隆大学博士,曾在Conviva工作,且是Apache Spark系统的早期贡献者,主要研究方向云计算和视频大数据。

公司已经获得累积数千万人民币的投资。公司导师包括计算机视觉、人脸识别、自动驾驶、AR/VR等领域创始人Takeo Kanade(金出武雄)教授,微软执行副总裁及人工智能负责人Harry Shum(沈向洋)院士,投资方有GGV资本的Hans Tung,及清流资本。已有合作伙伴,包括湖南卫视、芒果TV、浙江卫视等。