您的位置:首页 >> 新闻中心 >> 机器人新闻

机器人新闻

  • 一个会写字的机器人——NAO!

  •   当今科技突飞猛进,机器人和人工智能是当下的热点,人形机器人具有人的形态,以模仿真人作为目的制造的机器人,是未来机器人发展的方向。既然是人形机器人,那么有没有一种方法,就像教一个学龄儿童那样,也让一个人形智能机器人通过学习,掌握读书写字呢?下面介绍一下在 Nao 智能机器人上实现上述过程的技术方案。首先让我们来认识一下什么是 Nao 机器人。


      Nao 机器人简介

      Nao 机器人是日本软银机器人公司花费多年时间研制的一款可编程新型人工智能机器人,高 58cm,重5.4kg, 拥有 25 个自由度的身体, Nao 机器人外形如下图所示。



      在研究领域得到世界范围的广泛应用,不仅应用于机器人研究、人工智能、工程学和计算机科学领域,还运用在社会学和医疗保健领域, 其研究项目包括语音识别、视频处理、 模式识别、 自闭症治疗、 多智能体系统、 路径规划等。


      Nao 机器人开发平台简介

      Nao 机器人具有很灵活的可编程平台, 开发平台主要包括以下四个部分:

      其中 Choregraphe 可视化编程软件是它最主要的开发平台, 作为机器人的总控设计、 通讯、 动作编排、 调试等工具。


      总体技术方案

      Nao 机器人读书写字的总体思路是: 通过 Nao 自带的摄像头(眼睛) 对图片上的文字进行摄像,然后进行字符识别并朗读, 再根据识别的文字编码调用书写动作,完成汉字的书写。具体方案见图 1。

    图1 Nao 识字写字总体设计方案


      以上总体技术方案主要用到了字符识别技术(即 ORC技术) 和 Nao 机器人动作编排这两个技术, 接下来让我们着重谈谈这两方面的技术。


      文字识别——ORC 技术

      OCR 技术, 简单的讲就是图像文字识别并转化为文本文件的技术。OCR 技术的发展, 经历了如下三个阶段:

      第一阶段,识别印刷体的数字、英文和部分符号,必须指定字体;

      第二阶段,基于手写体字符识别,前期仅限于手写数字的识别;

      第三阶段,对于质量差的文档和大字符集识别,如识别汉字。

      OCR 技术研究已久, 已有不少成熟的 OCR 技术和产品产生, 比如汉王、 云脉、 ABBYY FineReader、Tesseract 等。在众多的 OCR 产品中, Tesseract 以其开源免费和识别效果良好的特点, 受到许多个人开发者以及一些小团队喜爱, 经常见到其应用在车牌识别、 名片识别等应用中。下面来就介绍如何来使用 Tesseract。

      首先下载 Tesseract - OCR 引擎, 注意要 3.0 以上才支持中文, 按照提示安装就行。下载 chi_sim.traindata 字库。要有这个字库才能识别中文( 这里我们让Nao识别的是汉字)。下好后, 放到 Tesseract - OCR 软件的 tessdata 文件夹里面。再下载 jTessBoxEditor, 这个是用来训练字库的, 放在Tesseract - OCR 目录下。做好以上准备工作后, 就可以对图像文字进行识别了, 一般来说原始的识别会有一些错误率,这个时候就需要用 jTessBoxEditor 对识别结果进行进一步校正和训练。最终形成经过训练过的汉字特征库。具体的操作细节在这里就不一一叙述, 图2 是这一过程的流程图。


    图2 汉字的识别训练


      教 Nao 机器人书写汉字

      现在 Nao 机器人能够识别文字, 但还不知道怎么书写, 所以我们在机器人书写汉字之前, 我们必须先教会机器人怎么写字, 这个过程采用手把手对 Nao 进行示教。在示教过程中采用 Choregraphe 可视化编程软件根据时间轴记录示每个笔画的起始位置和结束位置以及手臂各个关节的空间位置, 形成书写动作记忆。有必要的话还可以用Choregraphe 进一步优化书写的动作控制, 如图3所示。

    图3 教 Nao 机器人写字

      动作整合

      如果我们让Nao学写很多字,那么需要通过Choregraphe 可视化编程软件为每个字和动作建立联接,如图 4此外为了让 Nao 机器人在演示过程中表现连贯和拟人化, 还需要设计一些辅助的模块, 比如设计 Nao 机器人的写字前的准备动作模块、 握笔和松笔动作模块,语音对话模块,当然还要有主机与 Nao 机器人的通讯模块等,这里就不再一一叙述。到这里让 Nao 机器人读书写字的方案就基本介绍完毕了。

    图4 动作整合

      总结

      以上技术方案我们已经通过在 Nao 机器人身上得到实现并取得满意的效果,介绍了智能机器人 Nao 及如何在其开发平台上实现让 Nao 机器人像人一样通过学习学会读书写字的技术方案。其中着重介绍了文字识别(ORC) 技术和机器人动作编排的 Choregraphe 可视化编程技术。该成果现场演示非常具有观赏性,可用于实验室展示、科技馆场馆表演,亦可作为的课堂教学,激发学生的学习兴趣; 同时也是一个很好的人工智能应用研究的切入点。


客户服务热线

18925062548

在线客服