打造“大国重器”高性能计算,联想与英特尔如何携手点亮数字经济加速度?
提到大数据、算力,普通人都不陌生,现在谁手机里还没点AI计算能力了,但说起高性能计算HPC,听起来就有些遥远了。
高性能计算的原理,是将计算机和服务器聚合在一起,通过集群式并行工作提高处理速度,因为计算能力强大,可以帮助人类探索科学、工程和商业领域的一些世界最大计算问题的答案。
举个例子,DNA测序需要比对成千上万个碱基对,天气预报需要融合几十个维度的数据,石油天然气勘探需要进行空间分析和建模,对于任何单一计算机来说都负荷太大了,有了高性能计算,就可以应对这些大型复杂的任务挑战。
所以近些年,高性能计算越来越成为衡量企业、研究机构乃至一个国家高科技水平的重要标志。根据Hyperion研究,到2022年,全球高性能计算HPC市场预计将达到440亿美元。
高性能计算逐渐为更多行业所青睐,而作为数字经济的底座,发展中国高性能计算产业的呼声也越来越高,一些先知先觉的计算企业开始着手布局中国高性能计算产业。
比如联想,2001年起进军高性能服务器领域,是最早针对高等院校和科研院所进行产品开发与市场拓展的厂商,在高性能计算领域积累了大量成果。在国际组织“TOP500”公布的最新全球高性能计算机TOP500榜单中,联想制造的高性能计算机占据184台,以36.8%的总体份额,连续第七次名列全球高性能计算提供商份额第一名。在前不久的第七届联想创新科技大会(Lenovo Tech World 2021)上,联想基础设施方案业务集团(ISG)发布了最新的《联想高性能计算解决方案白皮书》,为高性能计算进一步走进产业应用,画下了完整的路线图。比如联想的战略合作伙伴英特尔,从算力角度来讲,面向多元化架构快速发展,通过异构的方式来去解决用户不同算力上的需求,支持更多的工作负载,更丰富的场景,满足更多的用户需求,迎来更大的市场。
高性能计算的发展现状如何?行业应用有哪些具体指标?让我们从白皮书中来窥视中国高性能计算的路线图,你可能会发现,联想的进击也是中国计算产业的进击,是一场与我们每个人日常生活息息相关的技术跃迁。
大国重器:高性能计算的启航
“旧时王谢堂前燕,飞入寻常百姓家”,这句话用来形容高性能计算近些年来的变化,倒也贴切。以往高性能计算主要应用在科研领域,用来模拟一些复杂的物理现象,比如天气、流体动力、分子相互作用、天体计算等等,听起来神秘又陌生。
现在,高性能计算也开始广泛应用于工业,比如用于设计新产品、模拟测试方案,减少新产品开发的时间;用于媒体和娱乐,渲染让观众身临其境的特效,支持全球大型体育赛事的直播活动;还可以与AI机器学习相结合,用于检测信用卡欺诈,训练自动驾驶汽车,进行糖尿病、癌症等疾病的诊断筛查。是不是立马就觉得亲切起来了?
随着物联网(IoT)、人工智能(AI)和三维成像等技术的发展,许多企业和组织需要处理的数据规模都在呈指数级增长,高性能计算未来还有更大的增长空间,是当之无愧的大国重器。
而一个优秀的HPC集群,往往需要以下几个特征:
1.领先性能,需要基于最新的处理器、存储和网络技术,满足业务所需的容量和性能要求;
2.建设经验。高性能计算的服务提供商应该具备为各种行业客户提供HPC负载的实践经验,从而保持业务高峰期的稳定性;
3.系统性交付。要以最大性能运行,高性能计算必须让存储、网络、计算等各个组件一起无缝运行,如果组件之间彼此跟不上,整个HPC基础设施的性能也将受到影响,所以高性能计算的交付不仅需要软硬件设备,还需要从系统层到应用软件层的全面解决方案和技术服务,来为应用效果保驾护航。
这也是为什么在高性能计算产业拥有一席之地的,基本都是头部服务器、计算厂商,具备系统性创新实力的企业,才具备打造“大国重器”的可能性。
大国工匠:
联想+英特尔铸就数字时代计算利刃
大国重器,自然要能在关键领域里发挥千钧之力。在《联想高性能计算解决方案白皮书》中,着重提到了教育、生物医药、石油勘探重点领域。高性能计算已经在千行百业中发挥其优势,我们不妨从重工业石油勘探入手,看看工匠联想是如何为石油行业淬炼出数字时代的一把计算利刃。
随着石油资源越来越少,石油开采也需要前往更复杂的地质环境,比如山区,而通过地震波法勘探收集到的数据容量通常都是TB级别,要在最短时间内完成计算,获得最佳的勘探效益,就依赖于复杂的模型和计算集群支持,以往只能使用超级计算机完成,而高性能计算解的出现就提供了一种新选择。
以石油解决方案为例,高性能计算在赋能石油行业时,主要具备五种特质:
1.性能优异。使用性能高、价格便宜的计算机集群系统,能够满足各种运算量极大的特殊数据处理算法需求,降低计算成本。联想基于第三代英特尔® 至强® 可扩展处理器的解决方案,就借助核心架构、内存带宽等方面的创新,增强了高性能计算系统的灵活性、功能性和互操作性,从而可以为科学探索、商业洞察等任务输出更优平台性能。
2.网络通信。联想采用了千兆以太网来管理和监控HPC系统,从而避免了网络拥塞可能带来的延迟和中断,让并行计算的数据通讯更加可靠稳定。
3.存储效率。大量采集回来的数据需要被存储起来,这也迫使企业的计算环境以服务器为中心转变成存储为中心。为此,联想设计了大容量高I/O吞吐率的系列存储产品DSS-D/DSS-G,高达28PB的存储容量、单集群高达400GB/s的I/O吞吐率、内置IBMGPFS分布式文件系统等,可以满足海量数据存储、处理的高性价比与高可靠性。
4.AI技术。将新的CPU、GPU产品引入高性能计算,能够让AI智能计算等能力被应用到行业当中。比如联想就与英特尔合作,将全新的第三代英特尔® 至强® 可扩展处理器引入HPC集群。作为一款数据中心级 CPU,该处理器针对多种工作负载类型和性能水平进行了优化,无论处于何处,都能快速处理大规模数据,可以满足一系列高性能计算的任务需求。同时,第三代英特尔® 至强® 可扩展处理器还对人工智能进行了集成加速,让生物医药、金融、制造等产业能够借助高性能计算,更加快速轻松地打造并部署智能模型。
5.系统软件。产业应用需要简单易用的管理工具,联想研发的LiCO高性能计算平台就在地震处理系统中承担着丰富的集群管理功能,包括集群管理和监控功能;集群资源管理和作业调度功能;用户和账户管理功能;集群系统监控功能等,大大降低了产业侧的管理和运维难度。
从硬件到软件,联想通过大量创新性研发,突破一大批高性能服务器的关键核心技术,从而打造出了支撑石油行业个性化需求的解决方案。不仅在石油领域,科学计算、城市管理、人工智能开发等产业中,联想的高性能基础设施也在发挥计算价值,助力实体经济的数字化转型,推动中国产业的高质量发展进入新阶段。
高性能计算带来超强算力的同时,也带来了更多的能耗。在国家碳中和、碳达峰的大环境下,高性能计算的建设也要充分考虑能耗。联想正在努力使高性能计算同时具备低碳和超强算力。其中值得一提的是联想的温水水冷技术:
联想独创的温水水冷技术利用纯水或去离子水作为冷媒(安全、环保、维护成本低),采用间接冷板式液冷方式对服务器进行冷却。通过减少对空调和系统风扇的需求,对比数据中心平均PUE1.9的普通的风冷系统,联想能将算力平台PUE值降至1.1以内,节约42%的能耗。同时可以利用散热温升后至60°的回水,进行有效余热再利用。使得能源有效再利用效率(ERE)和节能减排达到业界领先水平,大幅度降低计算所产生的能耗成本,以打造覆盖全行业的绿色低碳的智能基础设施解决方案。
《联想高性能计算解决方案白皮书》中介绍,截至2020年,联想先后为数万个用户成功实施了高性能机群,两次承担了中国科学院网络计算中心主节点的建设任务。联想帮助北京大学打造国内首个温水水冷高性能计算平台“未名一号”,PUE值达到1.1,居于国内领先水平,节省了50%的制冷散热成本,每年为北京大学节省60万度电。
联想为北京市气象局打造的温水水冷高性能计算系统,在大幅提高北京气象局核心业务计算能力近20倍的情况之下,通过温水水冷节点、行间空调、微模块等新技术,大大降低了系统运营成本,一年减少用电近200万度,为客户节省电耗30%。
大国情怀:
计算产业中的合作哲学
一直以来,高性能计算都被看作是服务器厂商研发能力的体现。但仅有技术上的突破和成果,就足够了吗?在与多个传统行业的交流中,不少管理者和IT人员都表达过类似的顾虑:根据行业特性需要定制化方案,现有人员无法满足快速增长数字化需求……
在千行百业的数字化转型升级过程中,算力是基础,但自身的IT团队未必具备用好“屠龙剑”的能力,造成不必要的浪费。对这些企业来说,除了优秀的软硬件产品,更难得的是共同奋斗、长期服务的意愿和能力。
为此,联想也将合作哲学带入了计算产业,主要体现在三个方面:
把产业当朋友,化繁为简:《联想高性能计算解决方案白皮书》中提到,前期联想会和客户进行充分地沟通和交流,了解客户的需求和想法,同时基于自身的产业实践经验,为客户提供最佳实践的方法论和建议。高性能计算集群的硬件和服务下单后,联想会安排一个或者多个实施工程师到达客户数据中心,完成实施服务。产业伙伴不需要花费大量的时间去学习集群知识、维护系统,通过实施工程师的丰富经验就能快速上手。在Lenovo Tech World 2021,联想更是发布了TruScale服务品牌,把硬件、软件、服务分散采购,设计、建设、运维分段实施的传统模式,整合成了一站全包服务,让传统行业的数字化转型更加轻松便捷。
把客户当朋友,一起“过日子”:在服务产业过程中,必然会遇到各种各样的需求,联想的态度是和产业伙伴“过日子”,与客户站在一起解决问题。比如前不久受水灾影响,郑州一家银行的数据中心宕机了,为了避免影响市民的正常交易,联想的两位工程师,一位负责划船,一位负责背着备件涉水而过,走了两个多小时到客户数据中心,顺利重启系统。这种长期服务的精神,也让很多客户有了跟联想“一生一世”的意愿。
把合作伙伴当朋友,掘金“新IT”:数字经济的机遇面前,联想通过与全球战略合作伙伴英特尔、ISV合作伙伴、上下游厂商等联合创新,不断推动高性能计算产业的产品创新、服务创新、模式创新,让细分垂直场景也能高效地引入新计算集群来赋能业务发展。
得益于英特尔数十年的创新,第三代英特尔® 至强® 可扩展处理器针对云、人工智能、企业、高性能计算、网络、安全和物联网等多种工作负载类型和性能水平进行了优化,可以加速高性能计算、人工智能、大数据分析等应用,为各行业构建灵活高效平台,加速产业数智化变革的进程。
比如在某南方医院中,联想为其构建了将近一个亿的整体系统,其中慢性病管理使用的手环、监测仪器,医院的服务器、存储、云平台软件、各种各样的终端,均由联想提供,联想的生态合作伙伴英特尔也参与其中,共同打造更完整、符合业务场景的行业个性化解决方案。
第三代英特尔® 至强® 可扩展处理器,连同英特尔的连接、存储和软件产品以及 oneAPI 跨架构工具,形成的产品组合能够提供强大而灵活的解决方案,让行业客户的传输更快、存储更多、计算更广。另外,全新第三代英特尔® 至强® 可扩展处理器也在核心架构上创新,更高的内存带宽和配置灵活性,带来出色性能,为多云架构的无缝协作奠定了基础,可以满足产业客户对多云的需求。
联想的合作哲学也展现出一个事实,计算领域的竞争不仅仅是产品的竞争,还是生态和系统的竞争,唯有如此才能让产业享受到最优质的服务。联想的长期陪伴,也是对产业最长情的告白。
大国进击:开启智能加速时刻
联想的高性能计算实力,正在得到更多伙伴的认可,成为数字经济的关键支撑。观察联想的布局与动作,会发现高性能计算正好踩在智能加速的时间点上。英特尔作为战略合作伙伴,也运用自身的创新技术给予无遗余力的支持。
我们都知道AI为核心的智能技术会给国民经济带来提质增效的重要价值,而公开数据显示,目前AI的产业渗透率还不到10%。阻挠在智能技术和产业升级之间的,正是算力这把钥匙。
用算力开启智能加速时刻,联想至少扮演了三种角色:
1.救火队。随着智能城市、智慧产业的项目推进,各类传感器等数据生成设备越来越多,一些领域的数据量、数据更新频次无限增长,已经到了不堪重负的阶段,需要联想高性能计算作为救火队员,快速解决这些领域的数据爆炸之困。
2.布道师。AI产业化应用后,越来越多的企业和组织需要高性能计算来支撑AI训练、AI计算,HPC服务商也是智能时代的布道师,通过极致算力、专业服务,让AI能够转化为企业、城市、国家的优势竞争力,奠定先发优势。
3.护卫者。对于计算产业来说,还要确保数据资产的安全与稳健,高可靠性的数字基础设施、自主研发的核心技术等现实需求,也在推动IT产业不断迭代,联想这样的高性能计算基础设施提供商更承担着护卫数字经济长期发展的重要角色。
总体而言,联想为中国高性能计算产业贡献了独一无二的探索和方案,这也是科技企业的社会责任所在,在充满不确定性的时代,能够不断出发、不断探寻、不断拥抱新技术,最终为世界找到一个确定性的价值和答案。
当高性能计算登上时代舞台,联想也成为数字经济与实体经济紧密结合的助推器,找到了开启自身增长的那把时代之钥。
对处理器如何赋能高性能计算感兴趣的读者,可以在英特尔官网获取更多信息。