机器人被广泛应用于自动化分拣、装配等智能制造领域。然而,由于现有数理及深度学习方法的局限性,机器人的操作动作生成方法(智能操作)尚未取得突破性进展。有鉴于此,有学者建议将语言学知识与运动学、力学知识结合,建立动词语义结构数据库,为机器人运动轨迹提供关键动作特征。该设想有望将人类语言转换为机器人可理解的形式,为机器人智能操作提供理论及技术支持。

现有智能操作方法存在局限性

智能制造的一个核心问题是智能操作,在许多自动化应用场合,如自动化分拣、装配等过程中,机器人经常被用来进行抓取、切割等操作作业,其操作轨迹及力特征主要基于两种方法生成:一为基于动力学及几何学的数理分析方法;二为基于深度学习的数据驱动方法。两类方法的优劣如下。

数理分析方法需为机器人提供精确的物体模型及相关运动学数据。因此,该方法主要关注已知物体模型,当存在模型参数误差时(如物体表面摩擦系数不准确),机器人很可能无法完成任务。因此,此类方法在实际应用中存在显著局限性。

基于深度学习的方法依赖海量的训练数据,这一依赖在实际应用中往往难以满足。另外,基于深度学习的方法存在迁移难题。例如,对于未经训练的物体,即使其参数与已训练物体存在极大相似性,只要(形状、重量、表面摩擦系数等)参数稍稍改变,此种微小变化亦可能导致操作失败。相应地,此类方法目前仍停留在技术研究阶段。

受限于上述两种方法的缺陷,机器人的操作轨迹生成仍依赖工程师手工示教/编程,且每种操作对象均需要示教/编程多次,严重制约了自动化生产效率。此外,值得注意的是,这两种方法亦是对语言资源的巨大浪费。人类语言是智能活动的抽象表达。例如,人类仅需少量的语言接触,即可生成无限的语言,亦可通过简单的语言指令执行复杂的任务。当今,语言资源比以往更为丰富,也更易获得。若能利用语言知识指导机器人操作,则有望突破目前智能操作的发展瓶颈。

拓展语言学在智能制造领域的应用

语言学在智能制造领域尚未见到应用,在人工智能领域的应用亦十分有限。自然语言处理曾借用语言学的形式理论和计算方法,但自20世纪七八十年代起,自然语言处理转向统计方法。陆俭明在《汉语研究的未来走向》一文中提出,目前的语言研究成果对人工智能似乎没有太大的贡献,唯一能挤进人工智能领域的是语音处理(包括识别与合成)和语义理解,然而其有效性仍依靠“深度学习+计算”,而非语言学领域的语音、语义规则。

同时,在智能时代的背景下,语言学研究者也在积极探索语言学与人工智能领域的融合。如北京外国语大学成立了人工智能与人类语言重点实验室,上海外国语大学成立了语言数据与智慧教育研究中心等。这些研究机构主要关注机器翻译、语音识别与语音合成、智能批改、写作问答等经典的语言学—人工智能融合问题,并未关注工业应用。

那么,语言学可为智能制造提供什么?自然语言处理是将抽象的人类语言转换成适合计算机处理的形式,从而建立语言、知识与客观世界之间的可计算关系,而我们要做的是建立从人类语言到机器人操作动作的转换关系。为了让机器人理解并执行操作,需要利用语言学知识还原动词的对应动作,精细描写操作动词的语义特征,并将这些语义特征表现为机器人可理解的形式。笔者就曾提出,力学理论可用于动词语义的分析及形式化描述。然而,形式化的动词语义仅是机器人理解语言的前提,在此基础上,仍需完成大规模语义结构库构建,才能为智能操作提供完整的动作语义知识。

构建操作动词的语义结构库

要完成操作任务,机器人系统需完成目标感知、运动规划等一系列步骤。由于目标感知依赖的视觉技术较为成熟,智能操作的主要难点即在于运动规划。认知语言学家塔尔米(L. Talmy)在《认知语义学》中提出,运动事件要素为移动主体、参照物、路径、方式。在机器人运动规划中,移动主体是机器人手臂,参照物是操作对象,路径是机器人或手臂移动路径,方式是手臂移动方式。例如,对于《装配钳工手册》中的操作任务“将螺钉拧出”,机器人需理解“拧出”的实际动作含义。“拧出”包含运动方式“拧”及运动方向(路径)“出”。其中,运动方向较易形式化,较易给出运动轨迹,然而运动方式动词“拧”的语义如何让机器人理解则是个难题。《新华字典》里对“拧”的释义为“用手指捏紧扭动”,在语言学领域,将“拧”的语义特征提取为[捏住][转动]。显然,机器人无法理解此类语义特征描述。因此,需要借助运动学、力学理论知识,将动词语义形式化描述为机器人可理解的语言。笔者在《语言学与智能制造的跨学科探索》中指出,在运动学框架下,操作动词的语义特征包含三个要素,包括工具与操作对象间的接触特征、工具的速度矢量、工具的力矢量。利用接触特征、速度矢量及力矢量,可定量地描述操作动词的语义特征。

基于以上方法,构建智能操作的语义结构库的步骤如下:第一,收集动词数据。本研究的最终目的是为机器人智能操作提供知识库,因此选取的动词是操作类动词。我们从操作说明书、装配钳工手册等资料中提取操作动词,如装配钳工操作中涉及的动词“拧出、锯下、錾掉、分割、切下、切削、切入、刃磨、锻好、切入”等。第二,提取语义特征参数。利用分布语义学工具,辅以概念语义场分析方法,利用语言学知识和机器人学知识,对具体操作动词,析取包含受事、工具、工具状态、受事状态、用力强度、用力方向、施力速度、路径等语义特征参数。第三,描写动词语义结构。基于操作动词语义特征参数,结合运动学方法,精细描写操作动词语义结构,并将其形式化表示。第四,创建语义结构库。以操作动词语义特征参数,以及操作动词语义特征的精细化、定量化描述为基础,创建操作动词语义结构库。以该语义结构库为基础,利用机器人学的方法,自动生成运动轨迹。

周建设、张文彦在《智能时代的语言学研究》一文中指出,越来越多的学者意识到,真正解决语义理解问题,还是要依靠语言学的理论成果,单纯依靠统计方法无法继续取得跨越性的突破。本研究拟构建的动词语义结构库正是这样一种尝试,希望将人类语言转换为机器人可理解的形式,助力智能制造的发展。

(本文系国家社科基金项目“致使交替现象的汉日对比研究”(18CYY056)阶段性成果)

(作者单位:陕西师范大学外国语学院)

关键词: 语言学智能制造语义结构人工智能