盘点一些多核心的CPU
2009-11-30 09:28:42 阿炯

硅谷小公司推出100核CPU性能是英特尔四倍


一个处理器(CPU)最多能有几个核,双核、四核还是八核?一家硅谷小公司给出的最新答案是:100个。

这家名为Tilera的公司在2009年11月推出的一款处理器产品震惊业界,其拥有100个内核。在芯片制造商纷纷通过增加内核数量来创造应用的今天,Tilera创下了世界记录——要知道,大部分基于X86架构的芯片厂商目前只能制造出4到6核的芯片,英特尔最先进的CPU拥有8个内核,而AMD 推出的Magny Cours也只拥有12个内核。Tilera的成立时间仅有5年,其创始人之一是麻省理工学院(MIT)教授阿南特·阿加瓦尔。由于这项在云计算技术方面的独特技术,使得该公司可以在云计算时代与英特尔、AMD、IBM等巨头直面竞争,最近其为台湾地区广达公司开发的云计算系统就被戴尔公司大量采用。今年10月,Tilera 获得了广达的1000万美元投资。

打破常规的理由在于,他们采用了一种不同于X86架构的思维。Tilera公司全球总裁兼CEO欧明德(Omid Tahernia)在上海接受本报记者独家专访时表示,传统CPU是一维总线架构,当核的个数超过了8个或者16个的时候,会产生性能上巨大的瓶颈,而 Tilera基于两维的网状架构,把重点放在了核与核之间的通讯,这样的方式在提供高性能应用的同时也能大大节约功耗。

Tilera称,这款100核的产品性能是英特尔相关CPU产品的4倍,耗能却仅有其三分之一。

1000核也不稀奇

《21世纪》:现在芯片服务商都在谈多核,Tilera却提出了“众多核”的概念,应该怎样理解这个概念?

欧明德:现在市场对多核的需求越来越多,主要是因为单核处理能力不可能像以往那样不断地提升。从上世纪90年代开始,整个产业遵循摩尔定律,即芯片上可容纳的晶体管数目每隔18个月便会增加一倍,性能也提升一倍。随着时间的推移,频率越来越快,运营指令不断提升,这让芯片设计越来越多碰到瓶颈,特别是功耗的瓶颈,因此对多核的需求就越来越高。“众多核”跟云计算相关。因为云计算时代对数据运算能力要求非常高,比如网络安全的防入侵管理,还有音视频的传输转换,计算量都非常大。在芯片发展过程中需要解决的核心的问题是功耗。“众多核”可以很好解决这个问题,必然是一个趋势。

《21世纪》:你们的100核产品,对英特尔这类传统CPU是一种颠覆吗?

欧明德:绝对是这样。从性能比上看,我们这款产品是英特尔相关芯片的12倍。很多人都不相信可以做到100个内核,这对编程思维是一个很大挑战,但是我们做到了,而且我还可以说,100核不是上限。由于打破了摩尔定律的限制,这个数量可以不断向上,我们预计核的数量平均每两年会翻一倍,以后听到上千个内核的CPU也不稀奇。

《21世纪》:这种颠覆性会在多大程度上冲击产业生态,或者引发产业格局的大变动?

欧明德:在芯片产业的价值链上,这种情况总在发生。当出现一种新技术或者新模式,更多的新面孔也跟着出现,市场就会开始洗牌。比如最近大家都看到的联发科,就是抓住了一个机会从而改变了产业。

一开始就把市场对准中国

《21世纪》:Tilera成立仅有五年,为何就能掌握如此先进的技术,这五年来你们主要做了哪些工作?

欧明德:虽然公司成立仅有5年,但从技术方面看已经有很多积累了。从1994年起,我们的CTO就在麻省理工大学开始二维网状架构的多核研究。2002年,他做出第一款真正16核的半导体产品。2004年,我们引入了包括华登国际等在内的四家著名风投,台积电也是我们的策略投资人,目前我们已经进行了三轮融资,到2007年就正式推出了商用产品。近两年,我们的重点是建立品牌和提高客户接受度,目前在全球已经有37种语言的发布,这方面互联网帮了很大的忙。

《21世纪》:未来在服务器市场你们将与英特尔等大型企业展开正面竞争,作为一家小公司,你认为优势何在?

欧明德:英特尔是一家很成功的公司,我们不希望引起太多他们的关注。需要强调的是,我们的技术来自MIT,有着16年的研发积累,目前拥有50 多项多核相关的世界专利。另外,在硅谷,高校和产业有着很紧密的联系,从研究到产业转化,再到获得商业成功,有着很成熟的经验。这让我们更有信心成功。说到具体的竞争优势,作为小公司,我们在技术的先进性方面更有优势,而且更加灵活。首先,我们只专注细分领域的核心技术发展,不会进入到英特尔的传统PC市场去跟他们竞争。第二点更为重要,因为很多人不喜欢垄断,这让Tilera有机会得以发展。

《21世纪》:听说Tilera的产品可以应用于TD-SCDMA制式的基站,可以说你们一开始就把市场对准了中国,这个决策是基于怎样的判断?

欧明德:在TD-SCDMA系统里,这么一个高性能的多核处理器主要是集中在基站。在核心网上,我们主要做很多安全方面的处理。Tilera技术可以让基站更加小型化、软件化和统一化。目前我们25%-30%的利润来自中国。中国的OEM市场做得非常好,而且中国厂商有一个特点,就是在采纳新技术方面走在了世界前列。这让我们相信中国的客户能够很好地接纳Tilera的新技术。未来5年,随着云计算的发展,我想来自中国的利润百分比将会达到40%-45%。

《21世纪》:你认为对Tilera来说目前的最大挑战是什么?

欧明德:最大的挑战是要持续保持创新,保持在这个领域的技术领先性。另外一点,因为这是对编程思维的一个挑战,我们需要让更多人相信确实可以存在100个内核这件事。


432 核的 RISC-V 芯片已流片,被动散热、低功耗

2023年5月消息,一款由欧洲航天局(European Space Agency)赞助,并由苏黎世联邦理工学院和博洛尼亚大学的研究人员开发的 Occamy 处理器已经流片。该芯片采用两组 32 位 216 核 RISC-V 架构 chiplet(一共 432 核),外加未知数量的 64 位 FPU 用于矩阵计算,以及两个来自美光的 16GB HBM2e 内存(总共 32GB)。


这款处理器的内核通过中间层互连,可提供 0.75 FP64 TFLOPS 和 6 FP8 TFLOPS 的计算能力。然而,欧洲航天局及其开发合作伙伴都没有透露 Occamy 的功耗,不过传言称该芯片采用的是被动散热,也就是说这是一款低功耗处理器。

采用 chiplet 设计是该芯片的优势之一,因为它可以在后续封装中加入具有其他功能的小芯片,以在必要时提高某些负载能力。Occamy 的尺寸大约为 73 平方毫米,总共有 10 亿个晶体管,并采用 GlobalFoundries 的 12 纳米工艺打造。

73 平方毫米的芯片并不是一个特别大的芯片。例如,英特尔的 Alder Lake 采用的是 10 纳米工艺,芯片尺寸为 163 平方毫米;苹果的 M2 处理器采用的是 5 纳米工艺,尺寸则是 217 平方毫米,拥有 200 亿个晶体管。

Occamy CPU 是作为 EuPilot 计划的一部分而开发的,该计划打算开发本土的处理器,以减少对专有 x86 和 ARM 芯片的依赖。它也是欧洲航天局正在考虑用于太空飞行计算的众多芯片中的一款,将基于这款芯片验证可行性,目前还不能保证该芯片 100% 会在未来的航天任务中使用。