U盘大小的迷你计算平台免费得！你也能玩人工智能

2024-04-17 14:41:57

Intel 神经计算棒NCS2简介

英特尔NCS 2由最新一代的英特尔VPU（视觉处理单元）支持–英特尔Movidius Myriad X VPU。这是第一个具有神经计算引擎的VPU，可提供额外的性能。诸如Caffe，Tensor Flow或MXNet之类的深度学习神经网络可以与NCS2上的OpenVINO工具包集成。这些机器学习框架针对全新的深度神经网络（DNN）推理引擎进行了优化，该引擎提供的性能是前一代的八倍。

借助电脑和Intel NCS2，开发人员可以启动其AI和计算机视觉应用的开发，并在几分鐘内执行。英特尔NCS2在标準USB 3.0上运行，不需要其他硬体，从而使用户能够无缝转换由电脑训练好的模型，然后将其部署到各种边缘设备而不需连网或连云。

无论是开发智能相机，具有手势识别功能的无人机，工业机器人，还是下一代智能家居设备，英特尔神经计算棒2都能为开发人员提供更快塬型所需的功能。

英特尔第二代神经计算棒

扫码免费申请

智能机器手臂之视觉系统方案

接下来介绍这有趣的智能机器手臂之视觉系统方案，本方案是由许哲豪 Jack 开发的。Jack 是帮忙Intel 与Sertek 推广Intel OpenVINO 与Intel NCS2 的专家。如果大大通的好朋友们，对AI 的应用与开发有兴趣可以到Jack 的网站http://omnixri.blogspot.com/ 在这裡可以挖到很多宝喔。

方案目标

本方案希望透过物件(小蕃茄)标註、训练、推论(侦测)及深度资讯整合的框架及工作流程来让读者了解AI 应用开发的流程，解决自动计算小蕃茄(水果)空间位置(XYZ)，利用深度感测器Intel RealSense D435(以下简称D435)及神经运算棒二代Intel Neural Compute Stick 2(以下简称NCS2)加上开源视觉推论及神经网路优化工具包Intel OpenVINO (自带简化版OpenCV 3.4.1)来说明与实作一下「智能机器手臂的视觉系统」。

本方案主要是利用D435撷取到的彩色影像结合深度学习的物件定位算法YOLOv3找到水果位置(X,Y)，当CPU算力不足时还可使用Intel GPU或VPU(NCS2)加速计算，最后再加上D435撷取到的深度影像所对应位置的深度(Z)资讯，未来就可以让机器手臂正确地伸到正确空间位置(XYZ)夹取及摘取(剪切)水果了。

YOLOv3训练小蕃茄影像

本方案主要是以小蕃茄做为机械手臂视觉系统的模拟採收对象，但是一般常见开放资料集(如ImageNet, MS COCO)都没有合适的，所以只好自己收集、标註资料集。由于撰写本文时非生产季节加上没有合作的伙伴可以提供实际农场取像，于是只好上网买了一串塑胶製的小蕃茄，外观看起来非常逼真，作为本次实验的对象。

本次实验取像及测试的环境如图1所示。笔电上预先装好RealSense SDK及OpenVINO SDK，并插入神经运算棒(Intel NCS 2)作为加速计算用。RealSense D435插入笔电的USB 3.0埠(不支援USB 2.0)，小蕃茄距离D435约30公分，分别对小蕃茄正面和背面取像作为样本。为了快速取得大量样本，令摄影机每隔10个影格(0.33秒)拍一张照，拍摄期间以手移动小蕃茄位置及角度，以获得更多样性的样本。

图1 取像及测试工作环境示意图(OmniXRI整理製作)

为了节省后续标註及训练时间，所以只取得正面92张，背面79张，合计171张样本影像。当然这样的数量对深度学习的训练是非常不够的，这裡只是为了说明工作流程，所以暂时忽略后续训练及侦测正确性的高低。由于如何标註、训练资料集的工作步骤颇多，所以请直接参考【AI_Column】如何以YOLOv3训练自己的资料集─以小蕃茄为例。

经初步测试后，正确率实在有点糟糕，可能是小蕃茄(待侦测物件)重叠的太严重且训练及验证集的数量太少，同时又没有利用资料扩增手段改善。因此只能先用训练集来充当测试集，当然这只是为了方便解释后面的工作流程，一般正常情况下是绝不允许拿训练集或验证集来测试的，因为这样很容易落入过拟合区间造成正确率会异常飙高的问题。

若先排除上述过拟合问题，测试集被框到的小蕃茄数量明显比实际少很多，且很容易出现过大或过小的框，所以就在程式中加入长宽尺寸及比例来限制不正常的物件被侦测到。经过限制后被框到的小蕃茄位置及尺寸大致都还算正确，可是置信度高低差很多，有些甚至低到0.1(10%)以下，所以只好将置信度的门槛值设低一些，才不致于找不到任何物件，但缺点就是误判的机率就增高了。

至于正面及反面何者侦测较为正确，正面会辨识率略高于反面，猜想可能是绿色的蒂头没有很确实被训练到吧？另外虽然标註时已针对遮蔽小于1/2的小蕃茄都有加以标註，但实际上辨识出来的结果仍以形状较完整的被侦测到的机率较高。如图2即是小蕃茄在正面及反面以OpenVINO™执行YOLOv3的侦测结果。而图3及图4分别是塬始影像及物件侦测结果影像动画GIF档示意档，完整171张版动画GIF档请参考。

图2 小蕃茄侦测结果影像，左：正面，右：反面。(OmniXRI整理製作)

图3 小蕃茄塬始影像档(OmniXRI整理製作)

图4 小蕃茄侦测结果影像档(OmniXRI整理製作)

物件侦测加深度影像整合测试

经过前面的努力后终于可以进到最后的整合阶段了，透过OpenVINO™执行YOLOv3物件侦测功能并正确找出数个小蕃茄位置后，接下来就要开始判定那个小蕃茄优先採收。一般农民会从最靠近自己或最外层的开始採收，换一个说法就是距离最近的，此时RealSense D435的深度影像功能就派上用场了。不过事情有这么简单吗？

「李组长眉头一皱，发觉案情并不单纯」，从图5中可看出有几个问题：

深度摄影机的视野略大于彩色摄影机一些，导致小蕃茄在二组影像中的位置及尺寸也略有不同。
深度影像并不是很完整，有些破碎，尤其在物件边缘更是严重，甚至有阴影区(深度呈现黑色区域)无法计算出深度问题。
小蕃茄被框到的区域像素很多，就算对应到正确的位置，深度资料不只一笔要以何者为主。
小蕃茄本身直径约10~20mm，而D435能稳定表达的深度差大约5~10mm(视外在光源及摄像品质而定)，所以不同深度或相邻小蕃茄可能存在极接近甚至相同深度值，导致同时有数个小蕃茄产生相同採收顺序。

图5 RealSense D435深度影像与塬始彩色影像比对。(OmniXRI整理製作)

从上述问题大概可知要让机器手臂视觉系统稳定辨识出待抓取物件的距离真的不简单，这裡并不给出唯一解法，只是提供一些可能的做法，其它的留待有兴趣的朋友继续研究改善，以下就提供一些个人解题思考方向。

1.首先是视野问题，若被检出物件较大(是指佔画面比例而非实际外观尺寸)则可忽略此一问题，但待检物像小蕃茄尺寸时，则可能需要作简单视野校正工作，令深度影像放大、平移一些以符合彩色影像位置，如此就可取得较正确深度资讯。

2.再来深度解析度不足问题可能不易克服，这属于硬体限制，但对于更稳定检出部份则可以依实际现场状况微调RealSense D435的Laser发射功率。当摄影机太靠近待测物时，若Laser发射功率太强则会造成红外线影像不是有一堆细小光点，而是会变成一片惨白，那会造成不易计算正确视差(深度)。

3.关于要以何点的深度(距离)做为机械臂向前伸的距离，最简单的想法就是以框的中心点作为基準即可，但不幸的是这个点可能没有值或者值受到干扰而和实际有很大差距。如果容许较长的计算时间，则可考虑把框内所有深度值排序后取中位数或者以高斯分佈(中间优先权越重，越往外侧权重越低)计算深度值均值。当然若考量计算时间，则可在框中心取一小块(如10×10点)直接取平均值亦可。

4.最后是遇到深度相同问题时，则建议从物件框中心较靠外侧、上方的小蕃茄开始採收，如此较不会发生，下方小蕃茄被其它挡住，机械爪不易进入剪切问题。

本方案引用作者：「欧尼克斯实境互动工作室作者：Jack Hsu」
https://makerpro.cc/2019/12/use-openvino-and-realsense-for-mechanical-arm-3d-vision/?fbclid=IwAR1k2f3F_0bTvUbSwI0W2Vn64MNTCme7vfnHrEiaxIRBpetqGdHnKxbdFww

【特别报道】FPGA的新技术新机遇——2018英特尔FPGA教师大会侧记

一周之内,参加了两场FPGA的盛会.毋庸置疑,数据中心.AI的盛行,为FPGA带来了新的机遇和挑战.不过,赛灵思CEO已经宣称他们不是一家FPGA芯片厂商,而是一家平台厂商,还发布了新的平台--ACA ...
极市干货 | 第52期直播回放-极市平台在线训练&英特尔®OpenVINO™加速深度学习推理

➤分享大纲极市平台示例算法代码演示如何创建实例和在线训练如何在极市平台上封装SDK及自动测试如何利用OpenVINO™工具套件加速推理 OpenVINO™各主流深度学习框架转化代码案例转化代码案 ...
【青野映画】发起疯来自己都打！最强A7王索尼FX6摄影机深度体验

【青野映画】发起疯来自己都打！最强A7王索尼FX6摄影机深度体验
红军最早阅兵影像，由美国记者斯诺用摄影机拍下，来一起回顾下

红军最早阅兵影像，由美国记者斯诺用摄影机拍下，来一起回顾下
浅谈人工智能的学习

人工智能(AI)的发展是一个从学术研究.行业验证.商业落地.行业平台到智能生态的一层层深入过程,这也是人工智能理想的发展阶段.人工智能的重要性无需赘述,对AI学习对我们来说同样重要,但是如何学习人工智 ...
苏州超集：如何为深度学习加速？

从20世纪80年代以来,深度学习在算法.理论和应用等方面都获得巨大成功. 在人工智能的潮起潮落中,2006 年以来,"深度学习"开始成为一个新的科研热点,开始深入到很多行业,在很多 ...
一文看懂英特尔 2018 视觉解决方案及策略，OpenVINO 是关键

EEWORLD 电子资讯犀利解读技术干货每日更新五月份时,英特尔宣布推出OpenVINO工具包,它主要应用于将计算机图形和深度学习技术整合到前沿的视觉应用中.OpenVINO全称为开放式视觉推 ...
小学数学口算小技巧！计算快人一步！

小学数口算小技巧! 口算也称心算,它是一种不借助计算工具,主要依靠思维.记忆,直接算出得数的计算方式.新大纲指出:口算既是笔算.估算和简算的基础,也是计算能力的重要组成部分.由此可见,培养学生的计算能 ...
小程序在线生成平台与制作步骤教程

开发制作一个小程序分为6个步骤,注册第三方小程序平台.挑选模板.编辑设计内容.在线配置与打包.下载开发者工具上传程序包.提交审核与发布. 1.注册第三方工具主要是为了快速获取合适的模板,以鸣蝉建站为 ...
制图小技巧：如何获取免费高质量HDR贴图

又到了每周一次的制图教室啦.经过前面几期精彩图纸拆解教程之后,今天我们将继续转战制图技巧篇. 在本次教程里,笔者将和大家分享一个很多小伙伴经常咨询的制图问题:高质量HDR贴图的获取方法. HDR贴图 ...
蒸汽平台免费FPS射击游戏，玩起来简直是CS和COD的混合

本期为大家介绍一款,在蒸汽平台上的免费FPS多人射击游戏,名为<战争模式>,英文名为<warmode>,它的玩法就像是<CS>与<COD>的混合,里面没 ...
丰田L4级自动驾驶计算平台剖析

2021年4月12日,丰田汽车在日本市场推出丰田新款Mirai和雷克萨斯新款LS,新车配备Advanced Drive系统,该系统具备L2级自动驾驶技术.前者起售价格为860万日元(约合人民币51.5 ...
2022年！L4自动驾驶量产元年，双计算平台/激光雷达/执行冗余是主流

2022年,将是高级别自动驾驶量产的元年.考虑到L3对于人机接管的高要求,一些汽车制造商正在瞄准提前量产L4. 5月9日,中国AI汽车芯片公司地平线对外披露,公司第三款车规级芯片征程5 Journey ...
Pony.ai：L4自动驾驶车辆中央车载计算平台

本文来源:智车科技 / 导读 / 谈及无人车硬件,通常大家直接看到的是安装在车身周边的传感器,特别是曾经Velodyne 64 "全家桶"一度是L4无人驾驶开发车的标识.虽然无人驾 ...
小升初计算难题，全班投降，毫无头绪，看大神如何巧解！

小升初计算难题，全班投降，毫无头绪，看大神如何巧解！
王者荣耀体验服将开抢，体验服玩家免费送永久电玩小子和天魔体验

正式服将于1月29日进行"五军对决"版本更新.本周(1月22日-1月28日)为本赛季战队赛最后一轮的比赛,请各位召唤师照常参与哦~另外,1月29日版本更新后,我们将迎来2018年的 ...

U盘大小的迷你计算平台免费得！你也能玩人工智能

Intel 神经计算棒NCS2简介

智能机器手臂之视觉系统方案

方案目标

YOLOv3训练小蕃茄影像

相关推荐