环保工业产业

WOT黄舒泉:工业智能制造与边缘计算

2019-10-21 12:16:08 阅读量:9343

WOT黄舒泉:工业智能制造与边缘计算

原标题:WOT黄舒泉:工业智能制造与边缘计算

2018WOT全球软件与运维技术峰会日前于北京正式落下帷幕,在本届论坛上,来自九州云的黄舒泉先生就边缘计算的话题进行了精彩演讲。以下是演讲实录:

边缘计算是如何兴起的

大家都知道,过去的十年二十年以来云计算是非常火的一个概念。但最早的概念出现在上个世纪60年代,最早是由非常出名的一名教授,他提出了一个分时的概念。其实这个概念奠定了后面一系列计算的发展。因为有了分时,我们才想到需要有虚拟化这样的技术。需要用虚拟化来实现各种资源的共享,包括计算、存储、网络等等一系列资源的共享。

然后到了上个世纪的九十年代逐渐地才有人把正式的云的概念包装提出来。最早其实我们可以看到云其实是基于虚拟化技术演变发展过来的。而虚拟化技术最早并不是在我们现在熟悉的X86这个平台上。它最早其实是IBM的小型机、大型机上的一些虚拟化的技术。

等到了90年代才有了VMware开始把这个技术引入到X86平台。也正是因为X86平台对虚拟化技术一系列更好的支持,包括KVM项目逐渐的成熟,我们才有了云计算的爆发。这个可以看到大概在2005年、2006年的时候Google发布了一系列的云服务,以及亚马逊也发布了它的EC2的服务。

九州云黄舒泉

然后另外一个里程碑可以看到就是2010年的这个OpenStack。OpenStack作为一个开源的云计算的管理平台。它可以帮助我们使用KVM或者使用别的一些虚拟化的技术以及整合了像开源的这种存储的技术,OVS的网络虚拟化技术来实现一整套的云计算的平台的搭建。不需要像以前一样还是使用自己的一些研发去实现自己公司内部的一些系统去解决这样的问题。

所以逐渐从2010年开始OpenStack成为了云计算的开源领域的事实上的一个标准。接着才有了后面最近十年来云计算蓬勃的发展。企业对于自己内务要求比较高的可能会搭建私有云,主要供内部的系统服务。然后更注重于数据的安全性方法。

然后对于有能力、有IDC资源的一些厂家,他们可能逐渐转型成为公有云,他们也可以使用OpenStack技术来搭建一整套公有云的服务,对外提供服务。然后有些企业它也可以使用混合云的业务里提供这样的一个满足企业内部的需求。

所以我们其实可以看到,总结一下就是云计算它是过去十年来的一个主导的计算的模式。随着我们的这个移动手机的发展,我们还是把大部分的计算能力放在了后端。然后正式因为这种超大规模的数据中心,它才可以强化我们最早提出的这个资源共享分时这样一个概念,使得我们可以降低用户的成本,然后降低我们总体的运营的成本。所以这是云计算最近20年来发展的一个历程。

可以看到,有了这样的一个开源的云计算的技术,它使得我们有能力去软件定义数据中心。我们可以把传统的这种通过专有的设备、专有的技术,井仓式的结构的数据中心把它打散成为一种更通用型的数据中心。它是完全可以采用软件定义。

其实大家需要明白什么是软件定义,举一个最简单的例子,就是我所有的资源的调配,我都可以非常方便灵活地使用一个API的调用就可以去实现这点。这就是一个比较直白的软件定义的理解。

然后OpenStack他非常地灵活,他可以有不同的项目来专注于某一个资源的管理。比如说NOVA是帮助我们管理这个计算资源的。然后计算资源分别有什么呢?它可能是有虚拟化,大家可能非常地熟悉采用这个虚拟化的技术产生一个虚机。然后计算还有别的一些表现的形式。比如说裸机、裸金属、Bare Metal。通过Bare Metal的这种计算的形式,我们可以去承载更多比如说像HPC这类的应用。

另外现在也非常火的就是容器,容器也是一种计算表现的形式。当然OpenStack有别的项目去专门地为容器的管理而提供这样的一些服务了。但是OpenStack它通过把资源灵活地来管理,对外提供上层的API来实现我们可以根据自己的业务的需求而实现资源的灵活的调配,从而满足我们不断快速变化的需求。

所以云计算发展到这个时候,大家可以理解它对外是提供了一整套标准的API。这个API可以帮你去实现对计算存储网络的灵活的管理。这一点非常重要,因为其实边缘计算它的实质也是这样子。

边缘计算为了能够像我们在云计算这一端、在边缘端,我们也能够有灵活的这么一个软件的框架或者是架构来去管理,你在边缘端所有的计算存储网络的资源。

但是大家看一下现在边缘发展的一个情况。比如说刚刚提到的这个IOT。其实IOT是非常异构的一个环境,它可能有ARM的设备、Intel的设备,还有别的一些芯片的设备。这个异构的情况远远比云计算的这个领域要复杂得多。云计算现在可能大家用的就是X86或者是大机、小机,ARM可能都很少用。但边缘可能是完全不同的一个情况。

所以边缘的平台同样要解决云计算我们要解决的问题。所以它的问题远远更加地复杂。异构的环境、复杂的API的调度、计算存储网络的调度。对于计算存储网络。每一种这样三大资源其实都有非常复杂的表现的形式。以我刚才举例的计算来讲,就是容器、Bare Metal和虚拟机。

边缘其实同样遇到这样的一个问题。我在边缘也可以是启容器来承载更加复杂的一些应用。而更加传统的一些应用,我可以用虚拟机。高性能的EDN的应用我可以用Bare Metal,对吧?

所以这也希望给大家一点启发,就是云计算跟边缘计算其实在架构上是趋同,他们在某种程度上遇到的问题也类似。带着这样的一个想法我们可以看一下接下来对边缘计算的一些理解可能会有帮助。

九州云黄舒泉

工业智能制造与边缘计算

工业革命的演进最早其实是1.0,就是蒸汽机的发明,然后他带来了我们一种新的动力。然后到了电力,更方便地去使用各种各样的一些以电为主要能源的自动化的设备,从而实现了大规模的生产。

然后到工业的3.0,我们有集成电路,我们能够相对可编程地自动化地去实现我们一些复杂的工序。然后到了4.0其实并没有提出像之前1.0、2.0、3.0一样一些完全新的想法。他其实是说我要把原来很多孤立的一些设备,通过网络把它连接起来。所以网络化是4.0非常重要的一个特点。

另外一点就是智能化。我单单把所有的设备联网其实并没有什么用,关键是这些设备是不是智能地能够去帮我们做一些事情,以及它能够不断地反馈、不断地去改进我的工序,这才是更关键的一个事情。所以智能化+网络化是我们在工业4.0非常关注的两个特点。

边缘计算在这里面扮演了一个什么样的角色呢?其实边缘计算就像神经末梢一样,它赋予了我们在每一个联网的设备上的末端的智能化。为什么叫末端的智能化?因为更复杂的智能化,非常复杂的智能化其实这个决策还是必须由中心的云计算做出来的。因为它可能需要搜集全局的数据做一些分析。

但是边缘的智能化也是很重要,这里举了一个神经末梢的例子。我就以我们平时大家都会感受到的一个例子来说明。比如说我们生火,然后当你的手碰到这个火的时候,你会本能地把手指缩回来,因为你要趋利避害。所以你这个缩回来的动作其实是神经末梢的感觉。它通过你最末端地智能,本能的一个反映。这就是我们说边缘端给予了设备的一个反映。

如果你想一下这里有一个火,你的手碰到了火。你所有的感受到你的大脑里面,你再想两秒钟,这是一个火、很烫,你再收回来。这时候可能就会已经出现了很大的问题。

而边缘端其实就是赋予了我们很多设备本能的一些反应、本能的末端的一些智能。它给予了我们很多IOT设备感知的能力、智能的一些能力。再往上它把这些数据整理了之后可以到云端进行全局的分析,然后云端再把它整合的信息通过推送的方式推送到这个智能边界设备边缘端来不断提高边缘端所有的智能。所以是这么一个统一的结构。

所以从这个关键的技术体系和平台架构,我们可以看到在对于工业互联网领域最底层的就是这个边缘层它主要包括了这个设备的接入、协议的解析以及边缘数据的一些简单的处理。

然后处理完了之后它可以把这些数据反馈到我们中心服务器、中心云段的一些IaaS层,比如说就是我们常见的这个OpenStack这样的一个云基础设施。

然后云基础设施可以管理非常多的边缘的设备,成千上万个边缘设备。然后它把所有的数据进行一个汇总,汇总了之后上面有我们工业PaaS平台的一系列的工业特定领域的组件服务。比如说这个机器学习、可视化、数据清理、模型建模等等。

再往上可能是一些应用层。应用层,我可以把这样的一些数据分析处理完了之后,通过一些工业应用的系统,然后我可能是直接地控制某些生产线,也有可能是我进行一些报表。然后给我们的这个企业的负责人进行一些分析。

然后同时我也可以根据所有设备的一些传感器的情况分析这个设备的寿命来进行这个生产线的更替,对这个生产量进行一些预测等等。

我们再回到整个云+边缘的这个大架构来看。其实无非就是在我们传统的这个用户端或者终端领域和核心云端加了一个管道。也就是刚刚给大家最早看的这个CDN的例子,其实我们就是在中间加了一层。这一层也是同样非常地重要。它是跟我们之前在云计算领域是类似的,它也是有计算存储网络的资源。它也是需要对接的一个设备,它也是需要对外提供标准的API。所以它解决的问题、它面临的问题跟十年、二十年前我们在云计算的领域面对的问题也是类似的。我们带着这样的一个思路就可以去看边缘计算整个技术架构的发展。

现在有非常多的边缘计算的一些开源项目,主要的有三个。第一个是这个CORD,就是局端的这个,在电信领域的这个局端机房改造的项目。它通过把电信机房的局端改造成数据中心而对外提供更灵活的资源编排的能力。

然后第二个是vCO,也是一个开源的项目,它采用的网络编排是以OpenDaylight,然后资源承载是采用OpenStack。

第三个是最近比较火的这个Intel和AT&T一起捐献代码发布了这个Akraino项目。它的网络编排是ONAP,然后资源承载也是OpenStack。所以其实大家看到在边缘的开源项目中,资源承载这一层其实还是沿用了原来在云计算的一些技术的框架。比方说OpenStack,所以这也是九州云为什么把我们从云计算的技术一直把我们扩张到边缘计算的一个原因。

我们再根据刚刚看的那三部分,我们其实可以看一下总体的、具体里面的技术分别有什么。主要是三部分,最靠近用户,我们把它叫做数据源,然后中间的叫做edge computing,然后在核心云的我们把它叫做Cloud computing。在Data source这一端,其实数据采集我们就通过IOT设备进行数据采集。然后在边缘端的话其实它更重要的是一个数据搜集、数据的一些加密,然后如何把数据传送到核心云这么一些主要的技术。

然后它上面的这个基础的设施的管理,我们可以采用OpenStack,然后也可以采用容器化的方式来进行一些基础设施的管理。

在传统的云、数据中心中,我们可以采用比较常见的技术架构,比如说你采用容器的话,你可以使用这个KBS,存储可以采用ceph,然后云平台的管理你可以采用OpenStack。再往上就是一些管理性的组件,比如说你可以用ELK来进行一些数据的分析,采用SAHARA来做Big Data这个平台。然后通过neutron来提供一系列的LB的服务,可能这个需要有专门的管理的一些组件来进行远端的IOT设备的管理。

边缘端其实可以直接地去操控这个IOT的设备。因为他离用户更加近,所以他就可以提供实时性的操作。比如说某一条产线的变动。我通过换一些比如说以纺织为例,我通过剪切这个布都可以实时地进行一些操作。

当然边缘端到核心云端,它的传输途径也是很多的。一般边缘端可能是在,比如说以电信为例,它可能是在局端机房。那么它可能有较好的网络条件,我可以通过互联网或者甚至是光纤的方式直接跟我们的云端进行数据的交互。

当然也有可能它本身就是一个小的基站。那么如果没有这个网络的话可能就通过LT这样的一些无线网络进行数据的一些传输。

核心云端它扮演的一个角色其实就是搜集了非常多的边缘端的数据,然后它进行更复杂的运算之后,它可以把相关的更高的一些分析后的结果push到我们的边缘端。然后边缘端实现了一个模型的更新,然后还实现了自身的升级。所以这个是三个主要的模块之间他们交互的一个流程。

我们可以从纺织行业来看一下边缘计算带给了纺织行业什么样的好处。首先纺织行业其实都有一个非常重要的环节就是验布。因为像这么一个工厂里面,它一块布匹是非常大的,可能有几米宽、好几十米甚至上百米长。然后这么一大块布只要有一个小的瑕疵,那么其实若干米个布就废掉了。这个就对纺织企业就是一个非常大的损失。

那么传统就是整个布织完了之后,我需要一个工人站在这边不断地看这个布匹在滚动。一旦有一个瑕疵点,他就要暂停这台机器,然后用手标出这个瑕疵点在哪里。同时做上一个标记,在这个布匹的第几米有一个瑕疵点。接下来要做的一个事情就是这个机器需要去把这个瑕疵点找出来,然后裁掉,接上去另外一个布,然后继续进行滚动。

所以这个其实对于人力成本是非常地高的。然后对工人也是有损害的。因为长期看来,一个工人长期凝视着同一个颜色的布,准确性也会降低,同时对视力影响也很大。

所以根据一些统计,一个小时来讲,一个纺织工可能只能检测最多200个瑕疵点,而且他们每天工作的时长也是有限的。因为一旦时间过长的话,他总的这个误判的程度就会很高。因此其实就有一个想法是说,我能不能通过计算机视觉的办法,通过甚至是机器学习的方法,我来自动地找出这个布匹里的瑕疵点,这样子我就可以代替人工。然后我通过机器来标注这个点,然后回头能不能再自动地用机器去控制这个布匹裁剪,把这个瑕疵点自动裁剪掉。这样我就可以完全替换掉人了,我不需要人工去验布。

我通过一个机器上面装上摄像头,打上相关的光源,我不断地在滚。然后这个摄像头实时地识别这个布匹的质量。一旦发现某些瑕疵点,他自动地把这个机器停下来,然后自动地去让这个机器把瑕疵点给裁剪掉,然后再把布匹接起来,自动地去滚动。这个其实是纺织行业在验布环节希望改进的一个点。

所以现在比较多的一个方案其实是这么一个方案。就是说我需要有非常多的车间,有一到N个车间,然后每个车间又有非常多的织布机。然后在织布机上放了这摄像头,然后也放了比如说别的一些设备,像打印机、光源等等。

这时候所有的摄像头需要拍这个照片,拍了照片之后它再传输回我这整个企业统一的云平台。然后这个云平台对这个数据进行分析。分析完了之后它再把这个数据返回到这个车间的某一个验布机,看看在某一个地方有这个瑕疵点,你需要怎么做。

这种传统架构的缺陷就在于往往是一种事后的分析。也就是说我整卷布可能都卷完了,可能还要过一段时间,我这个工人才可以拿到这个报告说这个布第几米到第几米之间有瑕疵点,我应该去裁掉。所以这还有一个返工的工序。我需要看着这个报告把这个布重新地再打一遍,然后手工地把它再裁一遍。

因为整个图像在网络中的传输,尤其是非常多的车间的时候,这个传输的带宽是非常地高的。然后核心云平台处理能力也是有限的。所以这个时候等到他反馈回来的时候,其实这个延时一定很高,我不能实现刚刚说到实时的处理瑕疵点的这么一个事情。

因此我们当采用了这个边缘云的架构的时候,我们可以以车间为单位,或者是以这个验布机为单位。我在验布机的旁边可能就可以放上一个小的计算设备。然后这个计算设备它直接跟验布机的控制单位连接,它直接操作这个摄像头、光源以及旁边的这个打印机,它直接完成这个数据的采集。

我预先在企业的云平台中,我把已有的这个瑕疵库的特征给推送到我的边缘的云平台中去。这个验布机在边缘平台中跑的时候,边缘云平台根据我已有的瑕疵库先做一部分的识别。同时它也会离线地把这些数据再汇总到企业的云平台中。然后有企业的云平台不断地去更新这样的一个模型。所以虽然有可能刚开始我的准确性是由最原始的瑕疵库、特征库来决定的。

但随着我的车间不断地跑,我跑越多的布,我边缘云平台的整个特征或者整个瑕疵库它会不断地被完善、不断地被提升。所以这个准确率也是不断地提高的。

然后有了边缘云平台我可以更低延时地去操作这个验布机来完成我想做的一些自动化的操作。比如说完成自动的裁剪或者自动停下来,让这个验布工人去手动地做一些操作等等。所以引入了一个边缘的云平台,我们可以更快地在我们的验布机上做一些自动化的操作以及可以避免很多人工的操作,为企业节省人力的资源。

所以我们跟我们的合作伙伴进行了一些POC之后,其实可以发现这么一个智能的织布机,其实它可以在某种布的情况下,比如说我们现在只能识别这个特定,就是纯色的这种布。因为复杂颜色的这种布其实对特征的识别还是难度比较高的。

在这种相对简单一点的这种纯色补助的情况下,我们可以相当于五到六个人的人工织布机。

然后同时通过这样一个简单的项目,我们也帮助我们的企业完成了整个统一的验布机的管理。我可以通过边缘端采集验布机的数据,在统一的云平台中,我可以去看到所有验布机的一些指标,知道验布机生产的效率是什么,更好地帮助我们的企业去预测整个产线的一些能力等等。此次的分享就到这里,谢谢大家!

热点推荐

即时新闻

推荐文章