“上帝视角”的AI践行者

36氪的创业者朋友2019-10-08
让人好奇的是,一家能帮助警方快速破案的公司,是基于什么样的产品和技术逻辑?

AI视觉技术如何运用在城市安全,智慧视通选择站在用户背后,以视频智能分析、视频形体识别技术为核心,为公安、交通等垂直领域的服务方赋能。

抛开抽象的系统,智慧视通CEO丁超辉为我们描述了一个具体的应用场景:

“我碰到的第一个案例是在广东省黄圃镇,那里曾发生一起刑侦案件,涉案数据240G,人工处理成本大,而我们用一台服务器,运用视频分析和形体识别技术,将嫌疑人的行动轨迹串成一个路径。

让人好奇的是,一家能帮助警方快速破案的公司,是基于什么样的产品和技术逻辑?

基于形体库的侦查系统

对于丁超辉来说,加入智慧视通属意料之外,又意料之中。

 “当时我还在腾讯,因为业务,需要找一些算法合作的公司,接触到了智慧视通。”丁超辉表示,“我觉得他们做的事很有意义,我也想跳出技术的框架,后来,我干脆加入了。”丁超辉的加入,完成了智慧视通产品的迅速迭代,从警用视频侦查系统V1.0到警用视频侦查系统V3.0。

“这个系统是一款高性能的AI视频检索软件,采用形体识别追踪技术,对嫌疑人和车进行秒级跨摄像头检索,结合地理信息位置,生成并保存目标的行踪轨迹。”丁超辉告诉36氪浙江,“但很多场景中,不仅需要事后讨论,还需要实时分析,警用视频侦查系统在这方面还具备一定的局限性。”

 为了解决这个问题,智慧视通结合警用视频侦查系统研发出产品“形体库”,并在此次云栖大会上重磅发布。简单来说,形体库是人员身份和形体特征的结合,包括建库、检索和训练。其逻辑是,首先对跨境的形体自动建库,接着对形体进行特征合并,通过目标、检测、识别来实现自动化的数据标注,最后,结合实时分析,实现基于形体的布控。

形体库通过形体识别和人脸信息,把人体和身份信息关联起来,能够解决目标人换装、脸部遮挡等难题,更加准确地识别个人身份信息。可能有这样一个场景,在迪士尼的园区里,有个小朋友走丢了,园区负责人可以利用一张小孩子的照片结合形体库快速找到她的行动轨迹。

目前,智慧视通已经完成了A轮融资,并在云栖大会上智慧视通与航天联合研究院启动签约仪式,达成视觉AI与航天安防重大合作。此外,智慧视通的合作伙伴中有包括腾讯、CETC、深圳星火电子工程公司、天津智慧城市研究院等。 

支撑这一切的是智慧视通的AI技术。

核心AI能力

智慧视通的核心技术,由每个环节的核心技术共同组成。

谈及智慧视通的核心AI能力,算法总监李冠华表示是基于形体识别的视频搜索引擎,该引擎由三大架构和三大核心技术构成,实现了“AI+警务”的落地,节约警务人员的时间成本,提高办案效率。视频搜索引擎的三大架构中,首先是物理设备底层对系统运行的各种支持和参数监控;其次,上层面向不同业务和使用者开发的基础应用;最后是基础平台层,包括存储、管理服务、基础算法和任务调度等。

视频搜索引擎的核心技术主要分为三个方面:

一、目标检测和多目标跟踪

目前,视频处理的传统做法依然是将视频拆解为一帧一帧的图像,再逐帧进行处理,这样就丢失了在目标运动过程当中的动态特征,对运动和连续目标检测较弱。

针对这一点,智慧视通主要在算法上做了一些改进。

1)更强的单帧特征提取能力。这一方面,智慧视通建立了多尺度、多感受野、多级联的神经网络结构,能够克服不同目标大小、不同场景的影响。

2)更快的帧间信息传递。智慧视通在相邻帧之间利用特征传递的思想实现特征的连续性,克服了目标运动的影响;利用形体特征将同一个人关联起来,更利于跟踪。

3)检测和跟踪相互补充,相互辅助,充分利用对方的结果。

二、多特征融合的形体识别

谈及市场上相似的人脸识别,李冠华表示,在非配合的环境下,监控视频通常很难获得清晰的人脸图片,这对人脸识别的应用带来了许多限制。形体识别主要基于目标的外貌、衣着、形体比例等多特征进行识别,能够适应不同人体姿态,不同视角,适应多种应用场景。

智慧视通主要从两方面考虑,帮助形体识别提取具有辨别能力的特征:

一是单帧图像静态的特征表达。由于人体空间自由度很高,会处于不同姿态、不同角度,比较起来较苦难,因此需要优先考虑人体不同部位之间的对齐后再比较。除此之外,智慧视通还结合了人体的整体特征进行综合表达,从而提高相互之间的区别能力。二是连续帧之间信息融合。除了单个目标以外,智慧视通对连续的运动状态也做了处理,融合前后帧之间的信息,从而得到其连续性的特征表达。

因而,形体识别过程能够依靠特征之间相似度判断,再通过人体的全局特征、局部特征、动态特征进行比对,综合衡量相似度,进而提高识别准确率。

三、以视频搜视频

以视频搜视频是智慧视通形体识别技术的综合应用,主要逻辑是依据目标的形体特征建立索引,对视频进行解码、目标检测和跟踪,接着对每个目标提取特征,检索时对比形体库中的形体特征,最终搜索视频。李冠华表示,目前,智慧视通的视频检索速度单GPU显卡达到10倍速以上,白天光照充足条件下, 检索准确度首行命中率95%以上。

技术是不断递进的,产品是不断迭代的。如果以前识别一个人需要一百步,那么现在可能只需要三十步。如何更好的利用技术,也许是智慧视通下一步考虑的关键。

关于未来

谈起智慧视通的长期规划,丁超辉表示,未来智慧视通要专注于智慧城市、平安城市,这是公司的愿景,也是行业的趋势。“现在有很多人在讨论技术的利弊,我一直相信技术无所谓好坏,只取决于用的人,相信技术向善,也相信我们的技术能够为城市安全贡献自己的一份力量。”智慧视通CEO丁超辉告诉36氪浙江。

目前,智慧视通以公安为切入口,将公安行业作为第一个产品化的目标。如果公安行业验证了做视觉的方式可行,那未来将会把技术应用到其他行业。如何用技术去赋能其他垂直行业,智慧视通已经做了一些尝试及对应方案。

“比如,高速公路是一条很难管理的线路,摄像头投放在高速路上,只能挨个看视频。我们希望以后能够反过来看,让监控人员有目标的看,通过这种方式来推动高速的智能化,打造智慧交通。”李冠华告诉36氪浙江。

面对一千多亿的视频安防市场,智慧视通未来发展如何,还有待时间的考量,但唯一不变的,就像丁超辉在采访最后表示,智慧视通在做城市大脑背后的坚守者!

+1
0

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

文章提及的项目

下一篇

快速扩张后,「失速」的趣头条。

2019-10-08

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

为你推送和解读最前沿、最有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚集全球最优秀的创业者,项目融资率接近97%,领跑行业