苏州超集：如何为深度学习加速？

2024-03-20 08:01:26

从20世纪80年代以来，深度学习在算法、理论和应用等方面都获得巨大成功。

在人工智能的潮起潮落中，2006 年以来，“深度学习”开始成为一个新的科研热点，开始深入到很多行业，在很多应用领域获得成功，相关的研究工作也得到了大力推广。

而随着各行各业数据量增加，类型增多，数据结构也趋于复杂化。传统的数据中心平台设备部署相互独立，需要较大的部署空间，存在着部署难、成本高等缺点，难以满足用户的要求。同时，软件、基础硬件、依赖包等品牌的类型众多，CPU型号多，不同的任务所需资源各异，增加了选型难度；此外，系统架构部署相对复杂，各种框架、模型的适配困难；系统容易出现各种故障，维护复杂等问题凸显。

为了应对这些庞杂的需求，苏州超集信息科技有限公司（以下简称“超集信息”）开发的深度学习AIO解决方案，为科研和应用领域提供一站式部署以及前所未有的便利与高性能。

软硬集成助力轻量级AI业务快速上线

超集信息的深度学习AIO 解决方案采用软硬一体化概念，深度融合机器学习平台与传统硬件，将第三代英特尔® 至强® 可扩展处理器作为核心算力支撑，部署了自研的AI Max深度学习平台并集成英特尔® OpenVINO工具包，充分利用AVX512特性，助力轻量级AI业务快速上线。

同时，该一站式方案可配合用户算力需求，支持高度定制基于第三代英特尔® 至强® 可扩展处理器的一体机的硬件配置。将现行的深度学习框架进行了整合和性能优化，封装大量底层操作，出厂前完成功能调试，实现开箱即用，大大降低深度学习从业人员的技术门槛。

打造专属的深度学习应用平台

AIO解决方案包括计算节点，存储节点和管理节点三部分：

计算节点

采用搭载的第三代英特尔® 至强® 可扩展处理器的高性能服务器作为计算节点，并在其上部署英特尔® OpenVINO工具套件。

英特尔® OpenVINO工具套件为用户提供了出色的深度学习推理工具，在第三代英特尔® 至强® 可扩展处理器增强的 AVX-512 指令和 VNNI 指令的加成上，极大地提升了推理的性能。英特尔® OpenVINO不仅提供已经训练好的主流深度学习模型，而且提供模型转换器将FP32模型转换为INT8模型，在可接受的精度损失下，提供成倍的推理性能提升。

Al Max机器学习平台是一款基于Docker+Kubernetes的全容器化人工智能容器云平台，深度整合了第三代英特尔® 至强® 可扩展处理器的加速特性，并将OpenVINO工具套件深度集成到AI Max机器学习镜像库，充分利用AVX-512指令集和Deep Learning Boost加速技术，能有效实现异构资源的高效管理、调度和监控，提供了从模型开发、训练到部署的完整流程和工具。广泛适用于教育、科研、金融、医疗、能源各个行业；能极大降低人工智能进入门槛，提高人工智能创新和研发的效率。

AI Max 机器学习平台的核心优势：

1) 具备智能的资源调度能力，按照CPU、Memory等使用情况动态调度资源，针对不同的优先级需求，保证任务最优分布，最大化提高资源使用效率，实现优先抢占、择优使用、按需分配、自动释放；

2) 提供丰富的机器学习镜像库，支持用户进行自由定制镜像，支持用户私有镜像的分享，提高镜像获取的效率、减少存储空间要求；

3) 支持通过VNC、SSH等方式进行模型开发调试，支持远程Debug和运行环境保存；

4) 基于SR-IOV容器网络接口，使用RDMA协议进行网络通信和数据读写，支持NFS本地缓存和基于GlusterFS的分布式存储，支持分布式训练和存储；

存储节点

采用搭载第三代英特尔® 至强® 可扩展处理器的多盘位服务器构建统一存储池，支持文件、对象、块存储，为用户提供高性能、易管理、易维护的存储平台。

管理节点

采用搭载第三代英特尔® 至强® 可扩展处理器的服务器作为管理节点，相比第二代英特尔® 至强® 可扩展处理器，第三代有着杰出性能提升，具有高性能、高稳定性、高可靠性的特点。

深度优势整合一站式解决方案

超集信息的深度学习AIO 解决方案融合传统硬件与深度学习软件，AI Max作为统一的资源调度管理平台，融合第三代英特尔®至强®的强大计算资源，打造软硬件一体的深度学习平台，加快平台中的快速整合，安全高效的数据管理，全面细致的监控管理，简化并降低开发人员开展深度学习研究的复杂度和门槛。

唯一内置深度学习加速的数据中心级处理器

第三代英特尔® 至强® 可扩展处理器是目前唯一内置人工智能加速功能的数据中心处理器。与第二代相比，第三代处理器采用均衡优化的架构，提升核心性能、内存和I/O带宽，通过AVX-512指令集和Deep Learning Boost加速从数据中心到边缘的各种工作负载技术。

第三代英特尔® 至强® 可扩展处理器的加速特性能在各种平台中被快速整合，AIO解决方案深度整合相关性能特性，为用户提供极致的性能体验。

基于英特尔® OpenVINO的高效推理性能

英特尔® OpenVINO内包含大量预训练模型，这些模型已经由英特尔®调优和封装，方便用户二次开发。用户可调用OpenVINO模型转换器，将模型转换后对模型进行优化，实现深度学习模型成倍的性能提升。此外，它还支持模型精度转换，可将预训练的FP32模型转换成INT8模型，降低精度损失，保障推理的准确性、完整性与时效性与第二代相比，OpenVINO模型推理在第三代英特尔® 至强® 可扩展处理器上的推理性有明显的提升。

高效集成、灵活可扩展的一站式解决方案

与市场上的常规解决方案相比，深度学习AIO解决方案在出厂前完成软硬件集成，并作为一站式解决方案交付：

简化深度学习环境的部署复杂性，提高资源利用率；
提高训练和推理环境的适用性，突破性能瓶颈；
具备资源调度、镜像定制、模型开发调试等功能；
安全高效的数据管理，全面细致的监控管理。

此外，方案支持灵活调节节点的数量和配置，可以很容易地扩展到更加广泛的行业应用和客户群体中去。

结束语

作为一家以数据中心、高性能计算以及OEM解决方案的领先企业，苏州超集信息科技有限公司正凭借42年IT整体解决方案经验、12年HPC计算解决方案经验和8年AI计算解决方案经验, 致力于攻克复杂计算挑战,满足产品研发需求,集成虚拟化应用,立志成为全球定制化解决方案的先行者。

【特别报道】FPGA的新技术新机遇——2018英特尔FPGA教师大会侧记

一周之内,参加了两场FPGA的盛会.毋庸置疑,数据中心.AI的盛行,为FPGA带来了新的机遇和挑战.不过,赛灵思CEO已经宣称他们不是一家FPGA芯片厂商,而是一家平台厂商,还发布了新的平台--ACA ...
一文看懂英特尔 2018 视觉解决方案及策略，OpenVINO 是关键

EEWORLD 电子资讯犀利解读技术干货每日更新五月份时,英特尔宣布推出OpenVINO工具包,它主要应用于将计算机图形和深度学习技术整合到前沿的视觉应用中.OpenVINO全称为开放式视觉推 ...
英特尔10nm服务器CPU来了，性能相比前代提升46%

英特尔首款10nm工艺的服务器处理器来了. 刚刚,英特尔发布了基于Ice Lake的第三代至强可扩展处理器. 第三代至强可扩展处理器覆盖从最低端的8核至强白银4309Y到最高端的40核至强铂金8380 ...
关于英特尔边缘计算，餐饮人还有这些需要了解

上周,红餐网(ID:hongcan18)通过<消费升级背景下的餐饮"新基建"竞速>一文分析了英特尔®边缘计算AI解决方案在火锅品类前厅中的智能应用,揭开了餐饮新基建&q ...
AMD VS 英特尔？本质就是一滴水和一片海洋的差距

去年,英特尔发布了4路和8路的第三代至强(Xeon)可扩展处理器,彼时预告了10nm Ice Lake的发布.时隔10个月,这一用于单路和双路系统的第三代至强可扩展处理器终于露出庐山真面目. 自从20 ...
第三代英特尔®至强®可扩展处理器

X是什么?每个人心中或许有不同的答案. 在数学方面,X代表着未知数:在坐标系统中常用来标识横坐标变量:在罗马数字里,Ⅹ代表十.当然还有一些时候,X表示无限,还有"目标"和&qu ...
三世而变至强新征途

自从纯64位处理器安腾退役,至强处理器就成为英特尔处理器组合中重要的一环,并逐步根据应用领域,细分出至强W.至强E.至强D以及至强可扩展等多个家族,覆盖从服务器到工作站.从高性能计算到AI加速等广泛领 ...
浅谈人工智能的学习

人工智能(AI)的发展是一个从学术研究.行业验证.商业落地.行业平台到智能生态的一层层深入过程,这也是人工智能理想的发展阶段.人工智能的重要性无需赘述,对AI学习对我们来说同样重要,但是如何学习人工智 ...
视频教程 | 英特尔® FPGA 深度学习加速技术

本次讲座将介绍如何使用Intel的工具在FPGA上实现深度学习推导及任务加速.还将讨论深度学习任务推导及工具包--针对不同的Intel不同的产品架构.不同的框架.不同的网络架构进行推导任务部署的时候, ...
不用GPU，稀疏化也能加速你的YOLOv3深度学习模型

第一时间获取价值内容水木番发自凹非寺来自|量子位你还在为神经网络模型里的冗余信息烦恼吗? 或者手上只有CPU,对一些只能用昂贵的GPU建立的深度学习模型"望眼欲穿"吗? ...
NTT高级科学家：光子是深度学习的未来！光子有望替代电子计算机加速神经网络计算

近日,来自日本 NTT 研究所的高级科学家 Ryan Hamerly 在 IEEE Spectrum 上发表了一篇文章("The Future of Deep Learning Is Pho ...
(10条消息) OpenCV之DNN模块，实现深度学习网络的推理加速

OpenCV是计算机视觉领域使用最为广泛的开源库,以功能全面使用方便著称.自3.3版本开始,OpenCV加入了对深度神经网络(DNN)推理运算的支持.在LiveVideoStack线上交流分享中英特尔 ...
极市干货 | 第52期直播回放-极市平台在线训练&英特尔®OpenVINO™加速深度学习推理

➤分享大纲极市平台示例算法代码演示如何创建实例和在线训练如何在极市平台上封装SDK及自动测试如何利用OpenVINO™工具套件加速推理 OpenVINO™各主流深度学习框架转化代码案例转化代码案 ...
PyTorch深度学习模型训练加速指南2021

作者:LORENZ KUHN 编译:ronghuaiyang 导读简要介绍在PyTorch中加速深度学习模型训练的一些最小改动.影响最大的方法.我既喜欢效率又喜欢ML,所以我想我也可以把它写下来. ...
最全攻略：利用LightSeq加速你的深度学习模型

算法码上来字节算法工程师,本硕专业第一,这里有算法.自然语言处理.模型加速等众多分享,你想要的这里都有. 228篇原创内容公众号 - BEGIN - 前言 LightSeq是字节跳动火山翻译团队开 ...
Colaboratory：手把手教你使用Google免费的云端IDE进行深度学习(免费的GPU加速)的详细攻略

Colaboratory:手把手教你使用Google免费的云端IDE进行深度学习(免费的GPU加速)的详细攻略 Colaboratory简介 Google 除了开源 TensorFlow 之外,还在不 ...
【软件工具】深度学习论文，如何画出漂亮的算法结构图？这个项目轻松帮你搞定

AI研习图书馆,发现不一样的精彩世界 ML visual-开源绘图项目一.引言随着人工智能技术的蓬勃发展,进入深度学习领域做科研的学者越来越多,深度学习研究呈现出百家争鸣.百花齐花的大好形势.众所 ...

苏州超集：如何为深度学习加速？

相关推荐