2020年4月9日,英特尔中国召开“年度战略纷享会”。会上,英特尔中国研究院院长宋继强先生介绍了英特尔在技术层面的一系列最新成果。宋院长表示:英特尔正在致力于创造改变世界的技术,造福地球上的每一个人,这就是英特尔的“凌云之智”。其指数级创新将在三个层面发生:智能连接、智能存储、智能计算。
英特尔当前的计算创新主要包括于2018年底发布的六大技术支柱战略:制程和封装、XPU架构、内存和存储、互连、安全以及集成一切的软件。这六大技术支柱不仅是英特尔未来数年推动自身创新的技术引擎,也是驱动整个行业智能创新变革的原动力。
其中值得一提的是摩尔定律的演进。现在英特尔制造工艺上的创新已经回归到两年周期。10nm制程的良品率大幅提升,在2020年英特尔将推出一系列新品。而7nm制程将在2021实现产品首发,直到2022年提供完整的产品组合。
在先进的封装技术方面,英特尔现在可以将在不同工艺节点上,已经测试好的小芯片chiplet,更好地进行大规模封装或者3D堆叠,有两种技术可以用——EMIB、FOVEROS。其中EMIB是在平面的架构里,通过米粒大小的封装工艺,实现CPU、图形卡、IO及其他多个芯片间的通信,而FOVEROS则是在三维空间提高晶体管密度和多功能集成(即我们常说的3D封装)。2019年7月之后,英特尔已经实现了两者相结合的CO-EMIB技术,这将赋予芯片设计的灵活性。
不但如此,英特尔还在不断加速推动计算架构的创新。英特尔Xe架构是一个非常灵活、扩展性极强的统一架构,针对性地划分成多个微架构。它可用于几乎所有计算、图形领域,包括百亿亿次高性能计算、深度学习与训练、云服务、多媒体编辑、工作站、游戏、轻薄笔记本、便携设备等。得益于在软件、XPU硬件和异构整合方面的进展,英特尔正在将“超异构”计算愿景变为现实。通过超异构计算,英特尔可以集成不同架构、不同制程、3D封装、互连和oneAPI等技术创新,为客户提供更多的灵活性和更快的产品上市时间,全方位推动计算创新发展。
在未来计算领域探索方面,宋院长表示:驱动未来计算颠覆性创新将会在三个维度发生,即未来计算、未来存储以及未来通信。其中,英特尔认为量子计算和神经拟态计算将是非常重要的两种新型未来计算方式。从存储或者内存技术来看,如何更好地存储数据,让数据与计算靠得更近是研究的方向。而从数据通信的角度来看,硅光通信将是一种全新的互联方式趋势。
代号“Loihi”的芯片项目是英特尔在2017年宣布进行研发的全新架构自主学习神经拟态芯片。其研发背景是随着自动化到人工智能的发展,越来越要求计算机的操作模式趋向于人类,需要实时处理非结构化和有噪声的数据,并不断地适应变化。它是以神经元的结构去开发,支持自主学习,即使在应用场景变化时,也能通过自主学习来进行适应,让机器像大脑一样思考。
不久前的3月27日,英特尔宣布其最强大的最新神经拟态系统——Pohoiki Springs已经准备就绪,能提供1亿个神经元的计算能力。Pohoiki Springs是一个数据中心机架式系统,是英特尔迄今为止开发的最大规模的神经拟态计算系统。它将768块Loihi神经拟态研究芯片集成在5台标准服务器大小的机箱中,以低于500瓦的功耗运行。该系统的神经容量已经增加到一个小型哺乳动物大脑(仓鼠的大脑大约为9000万个神经元)的大小,并且可以给很多合作伙伴提供云上的服务。
在今天的会议上,宋院长透露了更多细节。每一颗Loihi神经拟态芯片目前已经实现128核、13万神经元和1.3亿突触,每个神经拟态计算内核模拟多个“逻辑神经元”,而片上网络连接支持高效的脉冲信息分发。具备高度复杂的神经网络拓扑,支持多种学习模式的可扩展的片上学习能力,并且整合了计算和存储。
英特尔研究院与美国康奈尔大学在近期共同展示了基于Loihi的实验系统在存在明显噪声和遮盖的情况下,学习和识别危险化学品的能力。它仅需单一样本便可学会识别每一种气味,而且不会破坏它对先前所学气味的记忆。
Loihi方案展现出了极其出色的识别准确率,通过72个化学传感器活动组成的数据集,掌握10种不同气味的神经表征,对单一样本的识别率达到92%。传统方法中包括一种深度学习解决方案,但要达到与Loihi相同的分类准确率,该解决方案学习每类气味需要3,000倍以上的训练样本。
量子计算是一种全新计算模式,大家应该已经听过不少相关话题。通过量子位的相干,在多个量子位上可以实现超大规模的并行计算。如果将量子计算商业化比作“极限攀岩”,那么现在关于它的研究才刚刚启程。
宋院长认为:“未来,我们应关注如何构建能够用于解决棘手挑战的系统,即量子实用性。只有在成千上万个量子位可靠运行的情况下,量子计算机才能比超级计算机更快地解决实际问题。”
英特尔正在推进量子实用性,其重点在于:创造更好、更稳定的量子位,提升量子位连接性,开发一套可扩展的I/O。2019年底,英特尔研究院发布了代号为“Horse Ridge”的首款低温控制芯片,以加快全栈量子计算系统的开发步伐。作为量子实用性道路上的一个重要里程碑, Horse Ridge以一种高度集成的方式实现了对多个量子位的控制,并为向更大的系统扩展奠定了基础。
近内存计算,是指将数据在存储层级向上移动,使其更接近计算部件。这是未来数据处理最迫切的需求,特别是在AI计算方面。近内存计算单元,包含乘加器和单独的静态内存,能让内存和计算资源更紧密地结合在一起。同时,这种近内存计算单元可以构成分布式计算架构,使大规模数据处理的效率大幅攀升。
英特尔的每个近内存计算核心的尺寸仅为104μm×79μm,阵列配置可拥有68MB静态存储器,全部计算单元约1500个,能效更佳。
英特尔从很早就开始推动硅光子技术的研究。在今年3月,英特尔展示了业界首个一体封装光学以太网交换机。它成功将其1.6Tbps的硅光引擎与12.8 Tbps的可编程以太网交换机进行了集成。硅光通信作为一种新的互联方式,现在是进行下一代硅光互联研发的最佳时机。