一种通用型遥操作任务智能规划方法研究

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

姓名

邮箱

手机号码

标题

留言内容

验证码

一种通用型遥操作任务智能规划方法研究

航天飞行动力学技术重点实验室，北京 100094

北京航天飞行控制中心，北京 100094

中移（苏州）软件技术有限公司，苏州 215000

基金项目:国家重点研发计划“引力波探测”重大专项子课题“深空大尺度分布式系统天地协同管控技术研究”（2020YFC2200902）资助项目

详细信息

作者简介:
高宇辉（1978– ），男，高级工程师，主要研究方向：航天器任务规划。通讯地址：北京市海淀区北清路26号5130信箱120分箱（100094）电话：（010）66362898 E-mail：269659@qq.com

●　The hierarchical plan object model（HPOM）is proposed. In the decomposition process，the concept of "branch point" is introduced，which affects the decomposition result and expands the flexibility of HTN planning. The software architecture is universal and is expected to be further applied in the subsequent complex tasks.

●　In the hierarchical planning model，the method of transforming the planning problem with constraint behavior layer into PDDL planning problem is realized，which expands the idea of PDDL planning modeling.

●　Based on HPOM，the human-in-the-loop（HITL）method under human-computer cooperation is explored，and an automatic method of mapping high-level objects to low-level objects is designed，which shortens the time for operators to build task plans，and realizes the complementary advantages of human experts and intelligent planning system.

●　The method has been applied to chang'e-4 mission to support the success of the mission.

中图分类号:V411.4

Research of a General Teleoperation Task Intelligent Planning Method

Key Laboratory of National Defense on Aerospace Flight Dynamics Technology，Beijing 100094，China

Beijing Aerospace Control Center，Beijing 100094，China

China Shift（Suzhou）Software Technology Co.，Ltd，Suzhou 215000，China

摘要:在地外天体执行遥操作任务时，在复杂约束条件下会出现多分支作业选择困难、事件属性设置复杂等现实难题。提出了一种通用型任务智能规划方法——分层规划对象模型（Hierarchical Plan Object Model，HPOM），巡视器在地外天体作业时，其分解为多选项作业、带约束行为、多分支指令序列、参数化虚拟指令4个层次，将带约束行为表示的计划转化为行为规划问题进行求解，获得求解方法集合。采用“人机协同迭代求解”（Human-In-The-Loop，HITL）的处理流程，生成指令序列以期实现对不同规划粒度方案的一致性验证。该方法已成功应用于“嫦娥四号”（Chang'E-4 ，CE-4）任务，为任务圆满成功提供了技术支撑。

关键词:

Abstract:Based on the technical challenges of teleoperation tasks in China, a general task intelligent planning method with hierarchical plan object model（HPOM）is proposed, which decomposes the task of rover into four levels: multi option operation, constrained behavior, multi branch instruction sequence and parameterized virtual instruction. The plan represented by constrained behavior is transformed into a behavior planning problem, and a set of solving methods is obtained to solve the practical problems such as difficult selection of multi branch operation and complex setting of event attributes under complex constraints. A process flow of human-in-the-loop（HITL）is proposed to verify the consistency of different planning granularity schemes and generate instruction sequence. This method has been successfully applied to Chang'E-4 mission, providing technical support for the success of the mission.

Key words:

Highlights

●　The method has been applied to chang'e-4 mission to support the success of the mission.

序号	动作	起始时间	结束时间	电能	备注
1	进测控区	12-23T22：31：50.0000	12-23T22：37：00.0000	100	S1（太阳方位角和高度角：–116.173 422，26.179 856）
2	感知	12-23T22：37：00.0000	12-24T01：50：00.0000	86
3	盲走移动	12-24T01：50：00.0000	12-24T02：10：00.0000	97
4	感知	12-24T02：10：00.0000	12-24T05：30：00.0000	76	S2
5	盲走移动	12-24T05：30：00.0000	12-24T05：50：00.0000	82
6	感知	12-24T05：50：00.0000	12-24T09：10：00.0000	100	S3
7	盲走移动	12-24T09：10：00.0000	12-24T09：30：00.0010	100
8	感知	12-24T09：30：00.0010	12-24T11：17：10.0010	100	S4（太阳方位角和高度角：–104.552 687，16.357 985）
9	出测控区	12-24T12：53：34.0010	12-24T12：57：44.0010	100
10	进测控区	12-24T23：41：50.0010	12-24T23：47：00.0010	100
11	探测	12-24T23：47：00.0010	12-25T03：22：50.0010	100

序号

动作

起始时间

结束时间

电能

备注

进测控区

12-23T22：31：50.0000

12-23T22：37：00.0000

100

S1（太阳方位角和高度角：–116.173 422，26.179 856）

感知

12-23T22：37：00.0000

12-24T01：50：00.0000

盲走移动

12-24T01：50：00.0000

12-24T02：10：00.0000

感知

12-24T02：10：00.0000

12-24T05：30：00.0000

盲走移动

12-24T05：30：00.0000

12-24T05：50：00.0000

感知

12-24T05：50：00.0000

12-24T09：10：00.0000

100

盲走移动

12-24T09：10：00.0000

12-24T09：30：00.0010

100

感知

12-24T09：30：00.0010

12-24T11：17：10.0010

100

S4（太阳方位角和高度角：–104.552 687，16.357 985）

出测控区

12-24T12：53：34.0010

12-24T12：57：44.0010

100

进测控区

12-24T23：41：50.0010

12-24T23：47：00.0010

100

探测

12-24T23：47：00.0010

12-25T03：22：50.0010

100

一种通用型遥操作任务智能规划方法研究

1. 航天飞行动力学技术重点实验室，北京 100094
2. 北京航天飞行控制中心，北京 100094
3. 中移（苏州）软件技术有限公司，苏州 215000

基金项目:国家重点研发计划“引力波探测”重大专项子课题“深空大尺度分布式系统天地协同管控技术研究”（2020YFC2200902）资助项目

作者简介:
高宇辉（1978– ），男，高级工程师，主要研究方向：航天器任务规划。通讯地址：北京市海淀区北清路26号5130信箱120分箱（100094）电话：（010）66362898 E-mail：269659@qq.com

●　The method has been applied to chang'e-4 mission to support the success of the mission.

收稿日期:2020-10-28

修回日期:2021-01-13

网络出版日期:2021-06-19

刊出日期:2021-04-28

中图分类号:V411.4

关键词:

注释:

●　The method has been applied to chang'e-4 mission to support the success of the mission.

全文HTML

引　言

任务智能规划技术起源于状态空间搜索、定理证明和控制理论的研究，以及机器人技术、调度和其他领域的实际需要。在国防和空间技术领域，地外天体巡视器任务规划技术是任务智能规划技术的一类典型应用。巡视器自身是一个包含时间约束、数值约束、因果约束、能源约束等多种约束类型的强耦合系统，在计算理论中的问题求解难度是多项式空间完全（Polynomial SPACE- complete，PSPACE-complete）的；航天测控模式复杂，应急控制需求多样，需要专家参与来解决规划过程中遇到的约束冲突，系统需要新增一类条件约束，使得规划问题兼具了调度的需求，问题求解和系统设计变得更加复杂。

截至2021年4月，成功在月球和火星表面着陆并进行巡视勘察的巡视器共有12辆，包括中国2辆、苏联2辆、美国8辆。早期巡视器遥操作主要采用完全的是由人工控制的方法。苏联在1970年和1971年分别向月球发射了“月球车1号”（Lunokhod 1）和“月球车2号”（Lunokhod 2）两个巡视器，地面人员参考不同摄像头获取的小画幅图像辨识障碍、确定障碍距离、判断路线可穿越性并控制巡视器运动^[6]。美国在1971—1972年相继发射了“阿波罗15号”（Apollo 15）、“阿波罗16号”（Apollo 16）和“阿波罗17号”（Apollo 17）3个月面着陆器，均搭载了载人巡视器，巡视器的操控由宇航员实施^[6]。这类方法接近人类工作的方式，缺点是整个规划过程均在单一粒度上进行，计划编制时间长，规划系统智能程度低且容错性差。

2000年后，美国国家航空航天局（National Aeronautics and Space Administration，NASA）综合应用了多个任务智能规划技术，不断更新和扩展自动规划系统。在火星巡视器“火星探测漫游者”（Mars Exploration Rover，MER）和“火星科学实验室”（Mars Science Laboratory，MSL）项目中，“勇气号”（Spirit）、“机遇号”（Opportunity）和“好奇号”（Curiosity）采用的MAPGEN（Mixed initiative Activity Plan GENerator）自动规划系统在控制任务上取得超预期成功^[7-8]。MAPGEN系统由规划方案编辑器系统APGEN（Activity Plan Generator）和规划器EUROPA（Extensible Universal Remote Operations Planning Architecture），采用了人机协同的遥操作方法，支持操控员使用APGEN在时间线上对任务进行手动安排，由EUROPA完成逻辑推理、冲突提示和冲突消解^[9]。针对具体问题域的问题求解，EUROPA提供专门的算法。这类方法大幅缩短了遥操作规划的执行时间，但是规划效率依赖于规划求解算法的有效性。

2013年，成功着陆的“玉兔号”巡视器，实现了一种基于动作的经典规划，采用了地面控制与器上自主相结合的遥操作任务规划方式^[4，10]。但是该方法不支持动态调整巡视器活动序列，并且各自参数之间具有依赖关系，弱化了人机交互需求以及系统对约束冲突检测的能力。在“嫦娥四号”任务中，“玉兔二号”巡视器的工作范围处于月球背面的南极–艾特肯盆地（South Pole-Aitken basin，SPA）。着陆月球背面实施巡视探测，一直是各国开展月球探测的重要目标之一，在“嫦娥四号”任务之前各国均未实现。“嫦娥三号”的技术储备已不足以完成任务技术支持，需要研发新的平台解决复杂约束规划问题。

本文提出一种通用型的分层任务规划软件架构和人机协同的规划迭代求解方法，采用规划领域定义语言（Planning Domain Definition Language，PDDL）完成领域建模。基于上述方法实现的任务规划系统，成功应用于“嫦娥四号”任务，为任务圆满成功提供了技术支持。

2. 任务领域建模

本文采用PDDL规划语言，完成对领域模型和具体问题模型的描述。规划器识别规划语义，生成巡视器工作序列。对于规划解中的局部冲突和缺陷，采取解决冲突、弥补缺陷的算子，获得最佳重规划结果。

定义1　“状态”是真命题的有限集。每个命题的变量可为布尔变量（论域为{T，F}）或数值变量（论域为实数R）。

定义2　“行为”（动作）是一个三元组〈P，eff⁺，eff^-〉，其中P表示执行该行为的前提条件，为命题的有限集；eff⁺表示执行该行为后新成立的命题集，也称为添加效果；eff^-表示执行该行为后不再成立的命题集，也称为删除效果。eff⁺和eff^-中涉及同一数值变量的命题，可建模该变量的取值在动作执行前后的变化。

定义3（行为）规划问题表示为一个三元组〈Dom，I，G〉，其中Dom包含行为组成的有限集，描述动作所需的若干对象类型、函数和谓词；I表示在规划过程开始前已知成立的命题集，定义问题的初始状态；G为期望成立的命题集，定义问题的目标状态。

在定义2和定义3的基础上，为行为增加开始时间（start time）和持续时长（duration）两个属性，将工程问题转化为时态规划问题（Temporal Planning Problem）进行求解。依据各项预报数据确定命题的成立时间。如通信窗口预报数据中包含一个时间窗口[66，188]，即，在66~188 s 内存在一个通信链路，则构建命题对偶：(at(communication_accessible)66)和(at(not(communication_accessible))189)。其中，(communication_accessible)为表示可否通信的命题变量。采用行为逻辑顺序的约束关系构建行为集，为了建模这类顺序约束，提出的规则：若要求行为a₁在行为a₂之前执行则在a₂的前提中添加一个命题p_1-2，然后在a₁的添加效果中添加p_1-2，最后在初始状态I中指定命题p_1-2的值为F（假）。

每个外部计算过程必须在每次计算前获取详细的行为状态信息，才能确保规划计算结果的正确性。

例如充电行为的时长计算，与该行为的开始时间、巡视器航向和姿态、巡视器当前工作模式都有密切关系：

1）行为开始时间，影响太阳高度角，进一步影响巡视器两个太阳翼的光照夹角；

2）巡视器航向和姿态，影响太阳翼的遮蔽情况和光照夹角；

3）巡视器当前工作模式，不同工作模式下耗电不同，也会影响充电效率。

通过上述方法扩展PDDL语言，完成对巡视器的各种行为和具体任务问题的建模描述。行为模型与对象类型定义、函数定义、外部计算过程定义形成领域模型，具体任务所涉及的对象实例、初始状态和目标状态等描述一起形成具体问题模型。规划求解器以上述两个文件为输入，进行规划求解计算。支持PDDL语言所建模型的开源求解器较多，改进适用的求解器支持上述扩展语法，即可完成规划问题求解。

序号	动作	起始时间	结束时间	电能	备注
1	进测控区	12-23T22：31：50.0000	12-23T22：37：00.0000	100	S1（太阳方位角和高度角：–116.173 422，26.179 856）
2	感知	12-23T22：37：00.0000	12-24T01：50：00.0000	86
3	盲走移动	12-24T01：50：00.0000	12-24T02：10：00.0000	97
4	感知	12-24T02：10：00.0000	12-24T05：30：00.0000	76	S2
5	盲走移动	12-24T05：30：00.0000	12-24T05：50：00.0000	82
6	感知	12-24T05：50：00.0000	12-24T09：10：00.0000	100	S3
7	盲走移动	12-24T09：10：00.0000	12-24T09：30：00.0010	100
8	感知	12-24T09：30：00.0010	12-24T11：17：10.0010	100	S4（太阳方位角和高度角：–104.552 687，16.357 985）
9	出测控区	12-24T12：53：34.0010	12-24T12：57：44.0010	100
10	进测控区	12-24T23：41：50.0010	12-24T23：47：00.0010	100
11	探测	12-24T23：47：00.0010	12-25T03：22：50.0010	100

5. 结　论

本文提出的方法融合了分层规划、PDDL规划、人机结合等智能规划领域的多个概念。

1）提出的“分层规划对象模型”契合人类操控员自顶向下、逐步细化求精的规划模式。将作业分解为行为，将行为分解为指令序列。同时在分解过程中引入了“分支点”的概念，由分支点影响分解的结果，扩展了HTN规划的灵活性。软件架构具有通用性，有望在后续无人航天器、无人水下潜航器等复杂任务中获得进一步应用。

2）在分层规划的模型内，实现了将带约束行为层的规划问题转化为PDDL规划问题的方法，扩展了PDDL规划建模的使用思路。

3）以HPOM为基础探索人机协同下的HITL方法，设计了高层对象映射为低层对象的自动化方法，缩短了操控员构建任务计划的时间，实现了人类专家和智能规划系统的优势互补。

采用该方法设计实现的任务智能规划系统，在“嫦娥四号”任务“玉兔二号”巡视器遥操作任务中获得应用并取得预期效果，为任务的圆满成功提供了技术支撑。

参考文献 (11)

[1]	吴伟仁,王琼,唐玉华,等. “嫦娥4号”月球背面软着陆任务设计[J]. 深空探测学报(中英文),2017,4(2):111-117. WU W R,WANG Q,TANG Y H,et al. Design of Chang'E-4 Lunar farside soft-landing mission[J]. Journal of Deep Space Exploration,2017,4(2):111-117.
[2]	贾瑛卓,邹永廖,薛长斌,等. 嫦娥四号任务科学目标和有效载荷配置[J]. 空间科学学报,2018,38(1):118-130.doi:10.11728/cjss2018.01.118 JIA Y Z,ZOU Y L,XUE C B,et al. Scientific objectives and payloads of Chang'E-4 mission[J]. Chinese Journal of Space Science,2018,38(1):118-130.doi:10.11728/cjss2018.01.118
[3]	HOFFMANN J. Everything you always wanted to know about planning. KI 2011: advances in artificial intelligence[C]//34th Annual German Conference on AI. Berlin Heidelberg: Springer-Verlag, 2011.
[4]	高薇,蔡敦波,周建平,等. 嫦娥三号“玉兔号”巡视器行为规划方法[J]. 北京航空航天大学学报,2017,43(2):277-284. GAO W,CAI D B,ZHOU J P,et al. Activity planning method for Chang' E-3 "Jade Rabbit" rover[J]. Journal of Beijing University of Aeronautics and Astronautics,2017,43(2):277-284.
[5]	DAUTENHAHN K. The art of designing socially intelligent agents:science,fiction,and the human in the loop[J]. Applied Artificial Intelligence,1998,12(7-8):573-617.doi:10.1080/088395198117550
[6]	贾阳,张建利,李群智,等. 嫦娥三号巡视器遥操作系统设计与实现[J]. 中国科学:技术科学,2014,449(5):470-482. JIA Y,ZHANG J L,LI Q Z,et al. Design and realization for teleoperation system of the Chang'E-3 rover[J]. Scientia Sinica Technologica,2014,449(5):470-482.
[7]	AGHEVLI A, BACHMANN A, BRESINA J, et al. Planning applications for three Mars missions with Ensemble[C]//The 5th International Workshop on Planning and Scheduling for Space. Baltimore: [s.n.], 2006.
[8]	CHIEN S. A generalized timeline representation, services, and interface for automating space mission operationss[C]//SpaceOps Conferences 2012. Stockholm: [s.n.], 2012.
[9]	BARREIRO J, BOYCE M, DO M, et al. EUROPA: a platform for AI planning, scheduling, constraint programming, and optimization[C]//The 22nd International Conference on Automated Planning and Scheduling(ICAPS). Sao Paulo Brazil: [s.n.], 2012.
[10]	高薇,蔡敦波. 面向月面遥操作任务规划系统的搜索剪枝策略研究[J]. 航天控制,2017(4):73-78. GAO W,CAI D B. Search pruning strategy for mission planning in lunar teleoperation[J]. Aerospace Control,2017(4):73-78.
[11]	叶培建,孙泽洲,张熇,等. 嫦娥四号探测器系统任务设计[J]. 中国科学:技术科学,2019,49(2):124-137. YE P J,SUN Z Z,ZHANG H,et al. Mission design of Chang'e-4 probe system[J]. Scientia Sinica Technologica,2019,49(2):124-137.

[1]	彭德云, 谢剑锋, 赵凤才, 梁爽, 陈翔, 张爱成.月球采样返回飞控任务多目标协同规划设计. 深空探测学报(中英文）, 2022, 9(2): 191-201.doi:10.15982/j.issn.2096-9287.2022.20210082
[2]	刘思语, 黄勇, 李培佳, 杨鹏.稀疏观测模式的“嫦娥四号”中继星轨道确定. 深空探测学报(中英文）, 2022, 9(1): 14-20.doi:10.15982/j.issn.2096-9287.2022.20210071
[3]	王赤, 李磊, 张爱兵, 张珅毅, 侯东辉, 徐子贡, 谢良海, 王慧姿, 罗朋威, 郭静楠, 史全岐, 张小平.月表太阳风和粒子辐射环境—“嫦娥四号”观测新结果. 深空探测学报(中英文）, 2022, 9(3): 239-249.doi:10.15982/j.issn.2096-9287.2022.20220020
[4]	张宽, 于天一, 胡晓东, 刘传凯, 李立春, 赵焕洲.月面表层无人采样控制技术. 深空探测学报(中英文）, 2022, 9(2): 173-182.doi:10.15982/j.issn.2096-9287.2022.20210052
[5]	毛维杨, 王彬, 柳景兴, 熊新.基于强化学习的深空探测器自主任务规划方法. 深空探测学报(中英文）, 2022, 9(0): 1-12.doi:10.15982/j.issn.2096-9287.2022.20220049
[6]	牛东文, 段建锋, 欧阳琦, 张宇, 陈略, 王美.“嫦娥四号”中继星再生伪码测距数据定轨精度分析. 深空探测学报(中英文）, 2022, 9(1): 21-28.doi:10.15982/j.issn.2096-9287.2022.20191213002
[7]	胡晓东, 张宽, 谢圆, 张辉, 卢皓, 刘传凯, 陈翔, 赵焕洲, 谢剑锋.“嫦娥五号”月面采样机械臂路径规划. 深空探测学报(中英文）, 2021, 8(6): 564-571.doi:10.15982/j.issn.2096-9287.2021.20210095
[8]	于国斌.深空探测任务协同的系统工程方法应用及趋势. 深空探测学报(中英文）, 2021, 8(4): 407-415.doi:10.15982/j.issn.2096-9287.2021.20210036
[9]	裴照宇, 任俊杰, 彭兢, 王琼, 胡震宇, 李海涛, 黄磊, 耿光有.“嫦娥五号”任务总体方案权衡设计. 深空探测学报(中英文）, 2021, 8(3): 215-226.doi:10.15982/j.issn.2096-9287.2021.20210028
[10]	王明远, 王美, 平劲松, 韩松涛.月球空间环境研究进展. 深空探测学报(中英文）, 2021, 8(5): 486-494.doi:10.15982/j.issn.2096-9287.2021.20200013
[11]	徐瑞, 李朝玉, 朱圣英, 王棒, 梁子璇, 尚海滨.深空探测器自主规划技术研究进展. 深空探测学报(中英文）, 2021, 8(2): 111-123.doi:10.15982/j.issn.2096-9287.2021.20210039
[12]	王鑫, 赵清杰, 徐瑞.基于知识图谱的深空探测器任务规划建模. 深空探测学报(中英文）, 2021, 8(3): 315-323.doi:10.15982/j.issn.2096-9287.2021.20210030
[13]	叶志玲, 黄晓峰, 顾明.“嫦娥4号”自主运行任务的设计与实现. 深空探测学报(中英文）, 2019, 6(4): 358-363.doi:10.15982/j.issn.2095-7777.2019.04.007
[14]	朱立颖, 叶志玲, 李玉庆, 付中梁, 徐勇.小天体探测自主绕飞智能规划建模. 深空探测学报(中英文）, 2019, 6(5): 463-469.doi:10.15982/j.issn.2095-7777.2019.05.007
[15]	金颢, 徐瑞, 崔平远, 朱圣英.基于状态转移图的启发式深空探测器任务规划方法. 深空探测学报(中英文）, 2019, 6(4): 364-368.doi:10.15982/j.issn.2095-7777.2019.04.008
[16]	段建锋, 刘勇, 李勰, 陈明, 王兆魁.“嫦娥4号”中继星任务轨道确定问题初探. 深空探测学报(中英文）, 2018, 5(6): 531-538.doi:10.15982/j.issn.2095-7777.2018.06.005
[17]	彭德云, 邹雪梅, 李亮.月球背面探测任务多目标协同控制模式设计. 深空探测学报(中英文）, 2018, 5(6): 544-553.doi:10.15982/j.issn.2095-7777.2018.06.007
[18]	金颢, 徐瑞, 崔平远, 朱圣英.基于扩展状态深空探测器任务规划方法. 深空探测学报(中英文）, 2018, 5(6): 569-574.doi:10.15982/j.issn.2095-7777.2018.06.010
[19]	李群智, 贾阳, 彭松, 韩璐.月面巡视探测器任务规划顶层设计与实现. 深空探测学报(中英文）, 2017, 4(1): 58-65.doi:10.15982/j.issn.2095-7777.2017.01.009
[20]	唐歌实, 韩松涛, 陈略, 曹建峰, 任天鹏, 王美.深空网干涉测量技术在“嫦娥3号”任务中应用分析. 深空探测学报(中英文）, 2014, 1(2): 146-149.

留言板