航天五院502所总监刘磊:人工智能技术赋能空间飞行器控制系统发展 | 2020空天信息大会

左一2020-12-21
智能自主是未来空间任务的必然要求。

12月17日-18日,2020空天信息大会在杭州云栖小镇举行。大会在“空天地海、数智融合”的主题之下,充分展示空天信息产业和杭州数字经济的深度融合。两天大会,浓缩主峰会、空天信息产业论坛、路演会、无人机秀、闭门论坛等精彩环节,几百位来自商业航天、遥感、北斗、导航、测绘、时空大数据等领域的产业巨头、优秀企业、投资机构齐聚,一起回望中国航空航天快速崛起的发展史,一起展望空天信息产业的无限可能。

会中,来自中国空间技术研究院502所(北京控制工程研究所)总监刘磊分享了关于人工智能技术赋能空间飞行器控制系统的发展历程、典型应用、应用难点和未来方向。人工智能技术可以用于空间目标测量感知、地形匹配导航避障、空间飞行器全寿命自主控制、在轨服务和操作和空间精细操作视觉伺服智能控制等领域。随着未来空间任务的复杂和灵活多变,需要打造“感知–决策–操控”星上闭环的智能增强控制系统。目前的空间只能控制处于目标识别、自主机动的水平(第三级),距离知识迁移群体协同的第五级所要求的多智能体姿态轨道协同控制、协同感知和推理认知、群体决策与任务分配和群智涌现、多任务操控学习和协同操控、寿命预测和进化自修复等能力还有一定距离。预计到2040年,以上技术能力将会实现。

以下是刘磊的演讲实录,经36氪整理编辑:

各位同仁,大家上午好。非常荣幸有机会在2020空天信息大会上向大家报告和交流关于人工智能赋能空间飞行器控制系统发展的一些认识和思考。

我来自北京控制工程研究所,我们所是隶属于中国空间技术研究院的,自1956年建所之初就致力于航天器的控制系统、推进系统以及程控系统的研究设计实验,以及相关的部组件单机的研究工作。

伴随着中国航天事业的成长,我们已经为载人航天工程、北斗工程和探月工程提供了控制系统或推进系统。中国空天事业的80%以上的重大任务都是由我所里来提供控制和推进系统的。

所以,我想借此机会,与大家交流我们对空间飞行器控制系统发展的一些想法。

飞行器控制系统的发展历程

最早的东方一号卫星在轨飞行的时候,实际上是没有轨道控制和姿态控制的。现在的一些微纳卫星,可能有一些是有姿态控制的,但大多数也是没有轨道控制的。但是,随着任务的逐渐的复杂化,比如后续出现的通信卫星、北斗导航卫星,它们的轨控也是相对比较复杂的。所以,在控制的基础上,又发展了导航的功能。

而像载人航天工程、在轨的神州飞船、未来的空间站以及现在我们正在建的空间目标飞行器的交汇过程,对制导律的要求是非常高的。所以我们的姿轨控系统也逐渐发展成了制导导航与控制系统,也就是我们所说的GNC系统。

同时,随着任务的进一步的复杂化,比如说空间交互对接、月球软着陆,以及月面巡视探测的这种自主控制技术,我们面临的任务和目标的边界越来越宽,要求我们系统要向“感知-决策-控制”一体化的自主控制的方向发展。

比如说,我们昨天(12月17日)成功回收的嫦娥五号,对我们的姿态轨道控制系统(GNC系统)提出了非常高的挑战。它的每一个环节(月面上升入轨、环月交会对接、第二宇宙速度返回地球等)都是环环相扣的,不能有任何闪失。我们也很好的保障了这次任务。

AI在空间飞行器控制系统的典型应用

首先,关于人工智能和控制技术结合,我还是想从空间目标测量感知的方面来说。因为最早,我们的姿态和轨道控制都是利用的一些单一敏感器的。比如说,姿态测量的显敏感器,和一些角速度、线速度测量的敏感器。随着一些复杂任务的要求,比如说,空间操作的任务、在轨服务的任务,是非常复杂的。空间的目标已经不是已知的目标了,或者说目标呈现了一种非合作化。所以,测量姿态轨道的测量,已从单一的测量,向感知方向在发展;单一敏感器的配置,也向多传感器融合和智能识别技术的方向在发展。

测量感知存在着一些难点。比如说,在地面上的一颗卫星装备,有着热控层。而实际上,在实验室里,要模拟太空的光照条件,有些暗的地方可能亮了,有些地方有些亮的地方可能暗了。但是在卫星进行太空飞行的时候,实际上目标的某些关键特征点是相机识别不到的。

所以,这些问题和困难也需要我们利用现有的人工智能技术的和测量感知的敏感器结合,可以很好地利用人工智能技术来分类识别星上的特征点。比如说,目前我们已经采用了深度学习的技术,让单相机的功能做了大幅提升。

但是,目前也存在一些问题。有边界的图片是容易处理的,而实际在太空上,空域的目标范围在上百公里或上千公里的级别,是非常大的。也许我们看到的并不是一个点目标,所以,我们还需要继续发展像结构光、激光三维测量等这些技术,和我们的人工技术进步融合,做信息的融合处理。同时,我们可以让载荷做功能的复用。也就是说,在测量的同时也兼具目标识别和运动意图判断的能力。对于在轨道上飞行航天器,如果仅是按照目标的特征做识别,而没有根据一些轨道的信息、姿态或位置的运动信息融合的话,对目标的识别还是存在非常大困难的。

我们做落月的时候,我们模拟的月亮的情况和实际的落月过程,从光线到色彩等方面的情况是完全不一样的。也就是说,在地面上,即使已经做了一些特征的分类学习,并运用了人工智能的方法,但运用到实际场景上的差异还是非常大的。

我们要充分认识到太空和地外行星探测这些任务的巨大难点:没有无线电的导航信号、广阔的相似环境范围、大部分的未知地区、没有地标、磁场异常等。这和我们地面的一些无人系统、无人驾驶系统的差异还是非常大的。针对这个问题,目前也正在开展“惯性+视觉+激光/结构光”这样多源数据融合的新智能导航方法,目前实现了自主的定位,以及自主对场景的理解,比如说火星任务。我们还需要更多的对科学任务和场景做综合的理解,才能更好的去实现任务。

我在这也举一个例子:嫦娥四号的月背软着陆是世界性首创,实际上这个任务的挑战是非常巨大的。首先,需要选择一个规避石块、坡度等的落点。而且,落月速度非常大。在这样一个高速软着陆的过程当中,要快速的来识别目标点并进行避障,实际上我们突破了地形识别重建,使用了主减速目标的自学习。这个任务就是一个典型的感知、控制一体化的结果。

还有一个典型应用,就是空间飞行器全寿命的自主控制。空间飞行器目前在轨运行需要增强更多的自主功能。比如说遥感卫星对热点目标的一些自主观测等等,如果我们还要靠地面的指令去指挥的话,它效率是大幅降低的。

再有一方面的应用,是在轨服务与操作。这需要航天器具有自主感知测量、部位识别、决策规划、接近与柔顺捕获、在轨自主学习精准操作的能力。我们可以想象,太空中两个浮动的目标,去做精细的操作、维修建造的工作任务还是非常难的。这就像一个人站在湖里的船上,拿竹竿去控制球一样,不论是去捕获皮球还是控制皮球,都是非常难的。空间飞行器的自身质量和在轨飞行的速度也非常大,所以它产生的这些碰撞力都需要我们精确地克服。

所以,基于人工智能技术,我们开展了一些研究工作,包括完成了深度强化学习全流程的一些验证,实现了非结构环境的目标识别。

现在,已经做到了端到端的字符的控制。比如说,未来的想做卫星的自主加速度的工作,那么可以对卫星的加注端进行自主识别。但在太空当中,目标也是在运动的,光照条件是在时刻变化的。所以这也增加了我们人工智能技术应用的难度。我们在地面实验的过程当中也采用了一些学习训练的方法,较好地实现了这个空间操作的任务的需求。

AI如何赋能飞行器控制系统

我国将陆续实施“火星探测” 、“深空及在轨维修维护”、“载人登月与月球基地”等国家重大专项,这对空间飞行器的自主能力和智能水平提出了新的挑战。 比如说,智能遥感深空探测空间操作的任务有一个突出的特点,就是自主、长时和复杂化。需要我们更多样化的、高精度的、高可靠的测量感知的技术,以及更智能化的控制系统技术。同时,我们后续的任务也具有位置不确定、空间环境灵活多变、任务要求越来越高的可靠性的特点。这些普遍的要求也需要空间飞行器的能够对目标看得清、辨得准,对任务进行推理、思考,同时能够智能地去适应、积累经验,做到自我的管理和自我的提升。

杨嘉墀先生是我们是促进北斗导航系统应用的一个牵头建设者。他在上世纪80年代就提出,智能自主控制是未来航天技术的发展方向。在系统当中需要引入人工智能技术,以实现半自主或自主的运行。而现在,新一代的人工智能技术从数据算法、算力方面都提供了很多的先进支持。

人工智能技术赋能空间飞行器的控制发展,并不是再去研究已经水平很高的泛在技术,而是能够从控制系统的角度,在体系框架智能方面做深入研究,把现有的一些泛在智能算法融入到控制体系框架当中。新一代人工智能技术与控制技术的融合发展,能够推动空间飞行器的智能水平和自主运行能力的快速提升。

在这里,我也想再谈一下我们对智能控制的分级。并不是说现有的无人系统搞了智能分级,我们空间飞行器也要照葫芦画瓢。我们做分级,是为了更好的来识别任务的要求。并不是说所有的空间任务都要应用到人工智能。有些任务用现在的程控系统或者自动控制系统,可以简单有效的完成的。我们做智能分级,是为了更好的定位我们的任务目标,同时也从任务的能力要素方面,进一步的去分析和认识需要哪些人工智能的技术。

所以,经过分析,目前来看,我们的空间飞行器还是处在现在的L3的水平,也就是说,具备了目标识别和自主机动的能力。但这和未来的差距还是比较大的。刚才讲到,传统的航天器是一个半自主属性的航天器。而未来,还是要发展全自主属性的无人太空系统的。也就是说,需要把现在的传统的卫星等空间飞行器升级成无人自主的太空系统。

目前学界和产业界对于空间智能控制分级还没有一个标准化的认识。这里也是我们研究所从工程应用的角度提出的观点。

同时,在分级分类的基础之上,我们也考虑了智能自主控制的内涵。这个内涵我们也借也是借鉴了相关学者的一些研究:我们认为,系统具备感知、学习、推理、认知、执行、演化等类人行为属性的,能够对环境和态势的变化作出适应性反应,在没有人或其他系统干预的条件下实现目标的控制过程。

这样新的太空自主无人系统如何实现呢?为了适应新的空间任务,还需要打造“感知-决策-控制”的星上闭环的智能增强系统。

以前我们的空间飞行器的控制系统是按照指令序列来执行的。也就是说,我们不需要对任务理解,也不需要和环境、目标做任何交互。但现在的在轨维护任务、深空探测任务等等,都是未知的环境、未知的任务目标,这就需要我们和环境、目标有进一步的交互。我们想构建一个这样的新的闭环的系统,是为了建立信息的短回路,同时能够做信息的融合处理。当然,这个也是根据我们现在研究的现状提出的设想。

从空间飞行器的行为能力层面,智能是实践自主的重要的手段。我们明确了智能和自主的关系——智能的发展实际上是为了实现自主。

智能和自主同时也是来衡量空间飞行器控制能力和控制水平的两个方面。当然,这是站在控制角度来讲的。系统的智能水平的高低可以作为自主能力的评价要素,包括对智能技术的一些评测评估,也是站在这个角度上来考虑的。航天任务是要求万无一失和稳妥可靠的,而智能自主是让航天器进化到自主化的一个高级的阶段。

从这个体系架构层面,我们也是根据现在的工程研制的一些任务,我们有这样的一些体会,就是目前的我们的空间飞行器,我们从架构设计上来讲,条块的分割还是比较明显的。因为我们的任务的复杂化,我们的系统很多,我们这些系统的组成相对的封闭了自己,我们的信息的交互就受到了制约。

所以我们提出了要建立感知角色控制这样一体化的闭环系统,目的就是我们能够形成一个开放的架构和信息物理深度融合的体系,这样我们有利于我们的计算资源的有效的利用和软硬件资源的灵活的部署,能够赋能我们系统的发展。

感知,是对传统框架下轨道确定和自带测量的功能的扩展。感知包括了对环境和目标和任务意图的理解。

决策,指的是空间飞行器的未来发展需要自主任务规划和决策,是对传统制导的能力的扩展,根据用户的要求,自主进行分配、任务调整,包括完成任务的优化的排布、执行和重规划。这样可以解决现在目前传统的空间飞行器,自主导航任务规划决策非常依赖于地面而效率低的现状。

智能控制,是对传统的姿态轨道控制的一个扩展,强调的是“行为+评价”的学习模式。Action Intelligence(机器学习与智能操作)是我们未来进行操作任务、科学考察任务等等必须要考虑能力的扩展。

最后一个发展方向,是自主健康管理。这是对传统框架下“故障诊断与重构”的功能的扩展。这是对现有的航天器解析冗余、硬件备份的措施的传统故障诊断功能替代。未来,飞行器系统能够自主识别自身的异常,根据任务的需求做健康的管理。健康管理可以组成独立的Agent(智能体),并行于我们构建的“感知-决策-控制”回路。

总结

未来空间飞行器,要从目前的第三级要达到2040年第五级的目标。要实现后者,还需要突破群体智能自主控制等这些核心技术。我们目前的差距还是比较巨大的。

最后我想说,智能自主是我们未来空间任务的必然的要求。

令人非常欣喜的是,目前我们已经携手在杭州的知名高校和优势研究机构一起开展了“地外探测无人系统自主智能精准感知与操控”的这样国家级的重大专项研究。 我们也非常希望能够借助杭州这块人杰地灵的宝地,充分利用杭州人工智能优势资源聚集的特点,面向国家的重大的战略需求,突破空间无人系统自主感知与操控等共性关键技术,来推动人工智能与科学技术、空间技术的融合发展。

发现未来独角兽,项目BP发过来!

如果你的项目足够优秀,希望得到36氪浙江的报道,参加36氪浙江的“未来独角兽活动”,请将你的需求和BP发至36氪浙江项目征集邮箱:zhejiang@36kr.com,我们会及时回复。 

36氪浙江——让浙江创业者先看到未来! 

+1
2

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

文章提及的项目

下一篇

随着北上广深盒马门店趋于饱和,盒马的开店节奏也逐渐“去中心化”,开始向下一级市场布局。

2020-12-21

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

为你推送和解读最前沿、最有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚集全球最优秀的创业者,项目融资率接近97%,领跑行业