http://cpu.zol.com.cn/209/2092791_all.html#p2092791
2009年年末的时候,笔者曾经以处理器接口为主题推出过一篇回顾性文章,在文章中笔者阐述了从2001年到2009年十年的处理器接口的变迁。从中我们也了解了桌面级处理器的发展史。回顾请点击:《技术发展晴雨表 细数CPU接口10年变迁》转眼间1年的时间已经过去,一个属于融合架构的时代即将开启,属于独立处理器核心的时代即将结束。就在我们展望未来的时刻,也该坐下来静静的回顾一下曾经的独立架构时代了。于是,笔者便翻阅了众多的资料,终于写下了今天的这篇新的回顾性文章:从2000年伊始到2010年的独立架构时代。
2000年到2010年,Intel与AMD共推出了5种不同的架构,但考虑到AMD的K7架构的发布时间已经非常接近2000年,所以我们也将本不属于这一时间范围内的架构吸纳了进来。作为曾经的经典一代,我想也十分有必要将这一代架构列入我们回顾的列表中。好吧,接下来我们就按照时间的先后顺序开始本次的10年跨越式回顾。首先来看的是这11年间(K7在99年)两家芯片厂商都发布了哪些架构。
Intel与AMD产品架构更新时间图(图片截取自CPU-World)
上图是笔者在查阅资料时,从国外的CPU-World网站中截取的一段处理器架构更替时间表。笔者本打算自己做一个类似的表格,怎奈手懒便截取了外站的现成图。在此感谢CPU-World的编辑为我们提供了详细的信息。从图中可以了解到。从99年之后开始算起,Intel与AMD先后发布了K7,NetBurst,K8,Core,K10,和Nehalem等六个架构。这六个不同的架构便是本文的六位主角。我们首先从诞生最早的K7架构开始谈起。
早期Slot A接口核心K7架构Athlon处理器
1999年6月23日,AMD对外发布了K7架构处理器,并首次启用了Athlon(速龙)这一具有历史性意义的品牌。而K7架构的发布,更是将AMD推上了快速发展的轨道上,成为了Intel最具实力也是唯一的桌面级处理器竞争对手。
早期的K7架构处理器采用的是Slot A接口,虽然与Intel的奔腾II处理器接口类似,但二者并不能兼容,仔细看你会发现,二者的接口方向完全相反。当时基于这一接口的核心有Argon, Pluto/Orion,Thunderbird。其中最后的Thunderbird后来衍生成为Socket A也就是462接口产品,我们所熟知的雷鸟速龙便是采用这一核心。
Slot A接口
早期的K7架构处理器频率仅为500MHz-700MHz,随着工艺的不断进步,默认主频在不断的攀升,并且成为了首个将主频突破1GHz的桌面级处理器。K7架构所经历的制造工艺有0.18微米和0.13微米两个时代,虽然在当前来看那时的制作工艺非常落后,但在当时已经是绝对领先的技术了。
主频突破1GHz后AMD转用了462接口
在K7架构时代,AMD主要针对浮点运算进行了改进,引入了超级流水线浮点运算单元概念,使得每个Athlon CPU内部集成了3个浮点运算单元,每个单元都能够自己选择计算最佳类型的指令,为使用率高的指令提供冗余。由于拥有多个单元,同时执行多条浮点指令成为可能。此外,K7架构还引入了修订过的3DNow!多媒体指令集,即“增强3DNow!”,新添加了DSP指令集和一些Intel SSE指令集中有关扩展MMX的指令。正是基于这些新的改造,才使得AMD处理器首次在浮点性能上超过了Intel的奔腾处理器。AMD也由此开始了巅峰之作。
当时的Athlon(速龙)有两个不同的高速缓存。一级缓存的容量突破了x86的历史纪录——分离的128KB的2路关联缓存,其中64KB用于存储指令,另外64KB用于存储数据。相当于K6架构一级缓存的2倍,奔腾II和奔腾III的4倍。正如Intel奔腾II和以“Katamai”为代号的奔腾III,Athlon也有512KB的二级缓存。不过此二级缓存不是封入CPU内部的,而且在比CPU低的速度下运作。它插在一个64位的总线上,类似于AMD的K6-III和Intel的奔腾Pro。此64位的总线允许CPU同时访问缓存和内存,因此极大地提高了效率和带宽。改善了在K6-2架构中,由于二级缓存和内存共享前端总线而造成效率低下的问题。
一代超频经典巴顿核心速龙2500+处理器
采用Slot-A接口的K7速龙处理器还是首款将倍频锁死的AMD处理器,其目的是为了防止不法经销商对处理器进行频率更改而打磨销售。这一做法虽然很好的将市场进行了划分。但却令使用者失去了更改倍频提高频率的机会。当然,锁定倍频的出现并不是说AMD处理器就彻底与超频决裂。玩家仍然可以通过调节外频的方法提高处理器的主频,之后推出的巴顿核心速龙2500+处理器便是一款超频能力非常强悍的产品,并且广受超频玩家的喜爱。
可使用铅笔破解成为速龙的毒龙处理器
K7架构不仅面向主流级用户推出了速龙这一品牌,同时有面向于低端用户的毒龙和闪龙两个品牌。其中闪龙这一品牌在2004年被推出,同时取代了毒龙的市场地位。值得一提的是,现在的AMD处理器破解概念,早在K7架构时代就已经流行,虽然并不是现在的双核/三核变四核,但其效果还是相同的。当时的硬件爱好者通过对毒龙处理器L2金桥加以改造,可以使处理器的二级缓存翻倍成为速龙处理器。正是这一发现,让毒龙处理器成为了当时的抢手货。这一现象直到毒龙处理器下市才终止。
462接口历代速龙处理器
2003年9月,AMD推出了首款K8架构64位处理器,这也预示着64位时代的到来,同时这也预示着属于32位处理器K7架构时代的结束。2005年K7架构处理器正式停产,这也正式宣布了32位K7架构时代的终结。
K7架构虽然在功耗的表现上并没有超过同期的Intel奔腾III处理器,但在性能上已经与对手打成了平手。再凭借着价格和“作弊”(毒龙破解成速龙),AMD一举成为了桌面级处理器的领导厂商。
“高主频就是高性能”,现在看来这是一个多么可笑的问题啊。没错,由于工艺制程和架构设计等问题。高主频已经不再是高性能的代名词。但这一看起来人人皆知的错误概念在2000年可是高性能处理器的代名词。主流级别处理器也正是沿着这一思路进行更新的。而“高主频就等于高性能”一直到K8架构的出现,才正式将这一神话终结。我们接下来回顾的这一代架构——NetBurst便是笼罩在“高主频等于高性能”这一“神话”下的产物。
因为AMD K7架构的大获成功给Intel敲响了警钟,一向凭借垄断市场来发展的业界老大也感受到了身边的威胁。为了尽快摆脱AMD K7架构的影响。Intel决定推出一款超高性能的处理器,从而将AMD的成功扼杀。作为提升处理器性能的最有效也是最简单的手段,尽可能的提高主频被Intel列为了下一代处理器的首要位置。于是NetBurst在这种大背景下诞生了。
NetBurst首代核心Willamette
2000年11月,首款采用NetBurst架构处理器诞生,核心代号为Willamette,默认主频为1.4GHz。由于Willamette采用了与奔腾III完全不同的设计,因此Intel决定将Willamette进行重新命名,于是一个新的品牌由此诞生,这就是统治市场长达5年之久的奔腾4处理器,而NetBurst架构的市场统治时间更是长达8年。恐怕这一纪录在未来很难被打破了。
采用423接口的Willamette奔腾4处理器
NetBurst架构除了统治市场时间长,同时还是横跨工艺次代最多的架构。在NetBurst架构成为市场主流的年代。期间经历了0.18微米,0.13微米,90nm,和65nm四个工艺代。在Intel转入Tick-Tock策略之后,横跨四个工艺次代的架构也成为了历史。所以说NetBurst架构还是一个创纪录的产物。
早期的Pentium 4处理器采用的是0.18微米制造的Willamette核心,为了能够提供足够的带宽,Intel设计了全新的Socket 423接口,此时的CPU前端总线已经到达了当时惊人的400MHz,不得不说Socket 423接口的奔腾4处理器是当时的典范。不过随着处理器主频的逐步提升,423接口的局限性越来越明显,它严重制约了奔腾4处理器的主频提升。为了能够突破2GHz主频,Intel不得不放弃了Socket 423接口,启用了全新的Socket 478接口。
Socket 478接口
这一时期采用了Willamette核心的奔腾4处理器虽然主频得到了提高,达到了2GHz主频,且在性能上也重新压制了AMD的K7架构速龙处理器。但其市场表现力却非常糟糕。一方面是奔腾4处理器过高的主频带来了较高的发热,另一方面是Intel推广昂贵的Rambus内存让消费者难以接受。所以在这一阶段奔腾4看似取得了成功。而实质上却并未达到Intel预期的结果。
Willamette核心的主频虽然已经达到了2GHz,并力压AMD的K7架构处理器,但其表现力并没有达到Intel的预期。为此更高主频的核心Northwood被推上了舞台。这款核心使用了更先进的0.13微米制造工艺,并且保持了Willamette的20条流水线设计,还在后期版本中首次引入了超线程技术。随着主频的逐步攀升,处理器的前端总线频率也随着水涨船高,最终版本的前端总线频率已经达到了800MHz,最终成为了当时桌面级的最强者。
Northwood核心照片
在吸取了Willamette核心因受到Rambus内存价格过高而无法进行市场推广的经验教训。Intel取消了Rambus内存的限制,加入了对DDR内存的支持之中。同时Socket 478接口的应用也让处理器摆脱了主频的限制,Intel终于将奔腾4的主频推上了3GHz以上的高度。
早期的Northwood奔腾4处理器为了能够力压AMD的产品,除了将主频进行提升外,还将二级缓存容量进行了翻倍。从256KB增加到了512KB(晶体管数量从4200万增加到5500万),为了能够降低功耗还使用了0.13微米先进制造工艺。但新的Northwood奔腾4有一个较为严峻的问题。那就是上市没多久就被放弃的Socket 423平台无法进行升级。为了照顾老用户,Intel推出了一个能够让Socket 423主板使用Northwood处理器的转换器。
带有HT标志的奔腾4告知消费者这是可以支持双线程的处理器
超线程技术是Northwood核心的又一大特点,有了这项技术的帮忙,使得单核心的Northwood奔腾4处理器拥有了当时非常前卫的双线程支持能力。在早先发布的Northwood处理器中,只有3.06GHz的一款处理器支持该项技术。随后Intel发现这项技术已经成为了一项非常重要的卖点,为此又推出了一系列频率范围从2.4到3.0GHz的新款800MHz前端总线处理器,这些处理器的最大特点就是全部加入了对超线程技术的支持。此时的Intel凭借着超高主频和超线程技术的帮忙,终于在高性能上超越了AMD的K7架构。也将绝大部分市场牢牢掌握在了自己的手中。
支持超线程技术的3.06GHz奔腾4处理器
然而成功是要付出代价的。由于Intel一味的追求高主频,Northwood核心奔腾4的漏电和发热现象已经达到了惊人的地步。当内核电压超过1.7V时,处理器将随时间延长逐渐变得不稳定,直至最后坏掉完全不能再用。人们认为这是由于电子迁移这种物理现象导致的,其中CPU的内部通路由于过度的电子能量随着时间逐步退化。这也是超频会降低处理器使用寿命说法的来源之一。
NetBurst架构虽然功耗表现并不好,但毕竟还是一代成功的架构,从其存活时间上就可见一斑。在推出了众多130nm(0.13微米)处理器之后,Intel将降低功耗的法宝压在了提升制程上,同时也希望能够借此进一步提高处理器的主频。于是最后一代Socket 478接口奔腾4处理器诞生了,这就是尾号带有一个E为结尾的奔腾4处理器。但90nm工艺的奔腾4上市没有多久,竞争对手AMD的一个新的家族处理器诞生了,不仅在性能上追赶上了奔腾4处理器,而且还将处理器带进了64位时代。这就是经典的K8架构。为了能够巩固市场,Intel也做好了64位的准备。于是乎Netburst架构的新产品64位Prescott核心诞生了(Socket 478接口奔腾4 E也是采用该核心)。
LGA775接口
64位Prescott与之前奔腾4已经发生了一些质的变化,不仅全面普及了超线程技术,加入了对64位系统的支持。同时还将处理器的接口进行了升级。统治市场长达7年的LGA775时代开始了。LGA775接口与之前的接口相比已经将Socket更换成了LGA,这主要是Intel已经将原来的PGA-ZIF封装模式更换成了LGA封装模式。LGA封装模式的全称为Land Grid Array即平面网格阵列封装,他与PGA封装最大的不同在于将针脚从CPU上转移到了主板CPU插座上。CPU上仅留下的是相应数目的触点。这样做的好处是显而易见的。用户再也不用担心一不小心将处理器的触点弄断而无法使用CPU的问题了。此外,LGA封装可以有效提升处理器的信号强度、提升处理器频率,同时也可以提高处理器生产的良品率、降低生产成本。
Prescott核心代表作奔腾4 630处理器
Prescott核心处理器最大的特点不仅在超线程技术和64位技术上,同时在二级缓存容量上也有所突破。由于工艺提升,晶体管数量得到了增加,Prescott核心将二级缓存容量提升至了2MB,令处理器的性能得到了大增,同时新的SSE3指令集也添加到了新品中。令Prescott核心在主频不变的情况下性能得到了较大的提升。不过令Intel较为失望的是,LGA775的Prescott核心在功耗表现上仍然没有改进。所以最高主频也并没有比Socket 478接口奔腾4处理器有提升。
市场表现非常不错的奔腾D 820处理器
Prescott在主频上虽然没有突破,但在核心数量上却开创了先河。虽然在64位技术上Intel慢了AMD一步,但在双核处理器上并没有让步。继续使用Prescott核心整合出来了首款双核处理器,这就是奔腾D 800家族。虽然在高性能上Prescott核心还存有争议,但双核的概念已经得到了广泛传播,并且杀了AMD一记回马枪。令对手在一段时间内不得不使用单核产品对抗Intel。所以由此看来,Prescott核心在市场的表现还算得上是成功的。
Prescott核心在主频上的失利让Intel很是恼火,为了能够进一步提高处理器主频,Intel再一次将注意力转向了提升工艺制程的方法上。并且将处理器的流水线提高到了31级。在解决了以上全部问题之后,Netburst架构的最后一代产品Cedar Mill和Presler诞生了。这就是酷睿架构处理器上市前最后的单核处理器奔腾4 6X1(Cedar Mill)和非原生双核奔腾D 900(Presler)。
65nm制程超频能力极强的奔腾4 631处理器
最后一代Netburst架构处理器的出现并没能帮助Intel达成突破4GHz主频的心愿,而且65nm工艺也没能解决高功耗的问题。而此时,Intel与AMD的双核大战已经进行的如火如荼。新的酷睿架构产品也在2006年年中时问世,一瞬间便让Netburst架构没有了市场,一代叱咤风云的经典架构就这样草草的画上了句号。
意大利人将奔腾4的主频送上了8GHz
最后一代Netburst架构处理器虽然没能帮助Intel解决诸多问题,但他却创造了一个新的记录,那就是超频。凭借着65nm工艺和超长的流水线,最后一代奔腾4的超频能力极强。曾经有职业超频玩家将奔腾4 631的主频超过8GHz。这一超高的记录直到前不久才有人打破。由此来看,Netburst架构还算是成功的。
最后的Netburst架构双核处理器
Netburst架构是Intel在Tick-Tock战略前的最后一代作品,同时也是Intel在桌面芯片领域中少有的一个使用了8年之久的架构。它所服务的产品经历了32位,64位,单核,双核,Socket 423/478和LGA775接口,180nm,130nm,90nm和65nm四个工艺时代,可以算作是被更改了最多次的一代架构。虽然最终没能突破Intel设想的4GHz主频,而且性能功耗比也不算出色。但NetBurst依然可以算作是经典的。在这一代架构上,超线程技术和64位技术被应用并得到了推广,而且双核处理器也首次在NetBurst架构上得到尝试。最重要的,它还使Intel回到了追求性能功耗比的正轨上。所以由此看来,NetBurst架构仍然算得上是一代出色的架构设计。
NetBurst架构横跨8年,着实让笔者费了一番力气才写完。接下来笔者要为大家回顾的这代架构同样也需要一些篇幅才能搞定。这就是将AMD推向巅峰状态的K8架构。
1999年发布的K7架构不仅为AMD赢得了市场,同时也赢得了较高的声望。为了能够巩固成果,AMD着手进行了新一代架构的设计。新一代架构的最大特点是加入了64位技术的支持。鉴于Intel在安腾64上的经验,AMD将64位技术进行了新的设计,不仅可以支持64位微软Windows系统,同时还可以向下兼容32位系统,这一设计在后来得到了市场的认可。
首批上市的K8架构处理器
有了K7架构的成功,K8架构的推广也毫不费力,加之64位技术的通用性,K8架构处理器很快就得到了市场的认可。当然,AMD在这里还应该感谢一下当前的竞争对手NVIDIA,正是因为得到了NVIDIA在芯片组上的支持,AMD的K8架构才得以迅速推广。当然VIA在芯片组上的贡献同样巨大。
K8架构除了64位技术这一大亮点之外,另外的一项技术也同样值得我们关注,这就是HyperTransport总线技术。HyperTransport是一种为主板上的集成电路互连而设计的端到端总线技术,它可以在内存控制器、磁盘控制器以及PCI总线控制器之间提供更高的数据传输带宽。该技术的应用打破了前端总线带宽的限制,让处理器与内存之间的数据交换成倍增长。K8架构可以在较低主频下得到与Netburst架构高主频一样的性能便是基于该技术的应用。当然了,处理器中整合内存控制器也是该项技术应用的一部分。
HyperTransport总线技术示意图(图片源自驱动之家)
早期的K8架构处理器采用了与IBM共同开发的130nm SOI(绝缘硅)技术制造。并采用了新的Socket 754接口。首批处理器核心为ClawHammer。为了能够将处理器的功耗控制在较低的水平上,AMD还引入了Cool'n'Quiet的技术。该项技术可以保证用户运行一些对处理器负荷较少的程序时,相应降低处理器的速度和电压,从而达到省电的效果。
采用了Socket 754接口的处理器针脚
Socket 754接口的应用让64位技术首次进入了民间,加之AMD处理器的性能功耗比非常高,价格便宜。所以迅速被市场接受。但此时的K8架构还并算不上完善。首先Socket 754接口的HyperTransport传输速度较低,有效传输带宽仅为9.6G,限制了K8架构性能的发挥。此外,Socket 754接口ClawHammer核心处理器内置单通道DDR400内存控制器,并没有加入对双通道内存的支持。所以这款产品上市并没有多久便被AMD换下。Socket 939接口处理器诞生了。
Socket 939接口诞生于2004年6月,其目的就是为了取代Socket 754接口,以弥补早期K8架构不支持双通道内存的不足。升级针脚数量的同时,AMD还将HyperTransport的带宽进行了提升,令K8架构的整体性能再上了一个新的台阶。像速龙3000+这样1.8GHz主频的处理器,就已经达到了3GHz左右主频奔腾4处理器的性能,并且功耗还要比奔腾4更低。速龙处理器也成为了DIY市场中最受欢迎的产品。
939接口代表作速龙3000+处理器
使用Socket 939接口的K8架构核心众多,有ClawHammer(130nm),Newcastle(130nm),Winchester(90nm),Venice(90nm),San Diego(90nm)等。由于采用这些核心的处理器在型号命名上经常会出现重复的现象,所以很难让普通消费者搞明白谁是谁。其实这些核心在很大程度上就是步进的升级,或者是制程的变化。除了最后的San Diego核心二级缓存被扩大到了1MB(其他均为215KB)和加入了SSE3指令集的支持外,其他核心均没有什么不同。
E6核心速龙3000+一度成为市场中的抢手货
当时的速龙处理器几乎成为了游戏的代名词,只要是为玩游戏而装机的消费者基本上都会去选择速龙处理器。那时的速龙处理器也确实在游戏上很有造诣。因为浮点运算性能强悍,AMD平台对游戏更是得心应手。此外,当时E6(Venice核心)的速龙3000+处理器在超频的表现上也非常出色,众多玩家采购它都是看中了他的超频能力。速龙3000+也一度成为了抢手货。但在应用软件方面,AMD则表现不佳,因为很少与软件厂商合作,所以众多的办公族还是选用了Intel的产品。即便这样,仍然无法阻挡速龙处理器的热销。在05年的市场中,一颗散片速龙3000+处理器的价格都要在1000元以上,如果是超频能力强的E6(Venice核心)速龙3000+价格会更贵。可见当时的AMD是如何的强大。
Socket 939接口的硬伤是不支持DDR2内存
Socket 939接口的另外一个伟大之处是帮助AMD实现了双核的梦想,虽然当时Intel抢先一步进入了双核时代,但由于Intel的双核处理器沿用的是“高频低能”的NetBurst架构,而且是简单的将两个独立核心封装在处理器基板上,因此AMD发现了奔腾D双核处理器的诸多问题。为了能够打败对手的产品,AMD对K8架构进行了重大改进,首次将两颗处理器的底层进行了互联,使之成为了一颗芯片上的两个核心。不仅性能大幅提升,而且还保持了K8架构高性能低功耗的传统。此外,因为K8双核处理器是原生产品,AMD也为其冠以了真双核的名义。轰轰烈烈的双核处理器大战打响了。
Socket 939接口支持双通道内存,且超频能力优秀,看起来已经完美了。可是在此时DDR2内存突然发威了。价格一落千丈,一下子顶替了DDR内存的位置。这一下可愁坏了AMD。因为Socket 939接口的硬伤就是在内存的支持上。因为并没有加入对DDR2内存的支持。所以更换接口势在必行。在落后Intel半年之后,AMD终于推出了可支持DDR2内存的K8架构产品和相关的接口。这就是后来的AM2接口处理器。
AM2接口的推出帮助AMD巩固了市场份额,并且打开了双核处理器市场。此时的Intel因为早一步提出了双核概念,所以率先打响了双核竞争的第一枪。首先将双核奔腾D处理器的价格进行了下调。AMD为了巩固市场份额,也将双核处理器的价格进行了下调。很快的,单核产品便被淘汰了,取而代之的是以奔腾D和速龙 X2为首的双核集团。因Socket 939接口并不支持DDR2内存,所以AMD的首批双核处理器也很快消失在了市场之中。AM2接口成为了AMD抢占双核处理器市场的急先锋。
速龙 X2 3800+处理器是当时的大热门
当时AMD推出的双核处理器主要是Windsor核心的产品,因为K8架构功耗表现出色,因此并没有在工艺制程上有太多改进,依然继续使用90nm工艺制造。90nm工艺K8架构双核处理器共有两三个版本,分别是2*256KB二级缓存版本(代表作速龙 X2 3600+),2*512KB二级缓存版本(速龙 X2 3800+)和2*1MB二级缓存版本(代表作为速龙 X2 4000+)。因前者的单颗核心二级缓存容量与闪龙处理器相当,因此又被冠以了闪龙双核的名称。
不过受生产成本的限制,2*1MB二级缓存版本并没有推出很长的时间,在发布半年之后便被下架,仅限于服务器级别的Opteron上。
售价999美元的速龙 FX双核处理器
如日中天的AMD可谓是大出风头。恐怕现在又不少新玩家都不太清楚,在K8风光的年代AMD还有一款定位至尊基版的处理器。这就是速龙FX系列。当时的速龙FX系列处理器地位与当今的Intel酷睿i7至尊版相当。每颗售价高达999美元。不少疯狂的发烧友都会去选择这款产品,主要是在性能上的表现要高出Intel奔腾D至尊版不少。不过伴随着K8架构的没落,速龙FX系列也退出了历史舞台,这不免让人有些伤感。
65nm工艺不锁频的速龙5000+
2006年6月,Intel正式发布了全新酷睿架构处理器,这款处理器一改NetBurst架构的长流水线高主频的特性,而是转为了注重每瓦效能的低主频高性能。该架构一出便给了AMD当头一棒。因为AMD发现手中的K8架构在对抗酷睿架构的时候已经变得力不从心了。为了能够稳住阵脚,AMD决定提升K8架构的生产工艺,并且采用高端产品降价的策略来抗衡对手。最终的产物便是K8架构的最后经典——65nm工艺黑盒速龙5000+处理器。
2006年,AMD斥资54亿美元收购了显示芯片厂商ATi,由此拉开了CPU与GPU的融合序幕。不过这场并购案令AMD一下子变得捉襟见肘。新处理器的研发在得不到资金支持的情况下迟迟无法完成。并最终导致AMD使用老的K8架构与竞争对手抗衡,这一现象直到2007年11月K10架构推出才宣告结束。
2008年第二季度,AMD正式宣布K8架构处理器停产。从2003年K8架构诞生到2008年正式停产,K8架构总共打拼了5年的时间。虽然最终被竞争对手的酷睿架构打败。但作为一款2003年就已经诞生的产品来说,K8架构虽败犹荣,并且也将会是AMD历史上最为经典的一代架构。
追求突破4GHz高主频8年之久的NetBurst最终还是失败了,作为Intel总裁的贝瑞特不得已单膝下跪请求支持者的原谅。虽然雄心勃勃的4GHz主频计划最终以失败告终,但这并不代表Intel追求高性能的路走到了尽头。相反的,NetBurst架构的经验让Intel走上了高速发展之路。随之而来的Core架构便是Intel进行这方面尝试的最佳代表。同时也成为了LGA775平台的最后舞者。
贝瑞特请求支持者原谅4GHz处理器的失败
Core架构是Intel为了改善桌面级处理器性能与功耗,由零起步全新设计的架构,最大的特点是放弃了对超高主频的追求,它有14级流水线,相比NetBurst架构Prescott核心的31级足足少了一半。另外,它的运行核心由Netburst的一次可处理3个指令增加至4个。此外,Core架构还采用了原生双核心设计,两个核心的一级高速缓存互相连接,分享使用二级高速缓存。Core架构还将一个128位的SSE指令的运算时间由两个周期缩短为一个周期,并采用了全新的省电设计。所有核心在空闲时会降低主频,当有需要时则自动增速,以减低CPU的发热量,及其耗电量。通过这些设计令Core架构处理器在较低主频下就是得到了超高的性能,同时性能功耗比也达到了最佳化。
Core架构早期代表作酷睿双核E6600
早期的Core架构处理器采用的是65nm工艺Conroe核心,该核心将处理器的前端总线直接拉到了比奔腾D 900系还要高的1066MHz上。而主频最低型号E6300仅为1.86GHz,最高型号酷睿X6800也没有超过3GHz。但性能却高出了奔腾D处理器一大截。可见新架构在性能方面的设计还是下了一番功夫的。
Conroe核心被分为了两个版本,分别是2MB二级缓存的Allendale和4MB二级缓存的Conroe本身。其中采用Allendale的只有两个型号,分别为E6300和E6400,其他型号如E6600,E6700和X6800均为后者。在之后的一次更新中,Intel推出了同样基于Conroe核心但前端总线被提高至1333MHz的E6X50系列产品。进一步丰富了酷睿架构产品线。
酷睿QX6800是65nm工艺处理器中的最高端
Core架构在双核处理器上的尝试大获成功,Intel并没有停下脚步,立刻使用在奔腾D时代的做法,将两个Conroe核心封装在了一起,组成了首批四核心酷睿架构处理器。这一做法直到新的Nehalem架构出现才最终停止。即便如此,酷睿架构的性能依然是非常强大的。甚至以原生四核自居的AMD在45nm工艺处理器上市前,甚至没有任何一款产品能够打败Intel的65nm旗舰非原生四核酷睿QX6800。估计AMD的FX旗舰产品由此消失也就是因为这样的原因吧。
在65nm Core架构大获成功之后,Intel继续发力,将提升制造工艺放在了首要位置,并且将新的Nehalem架构提上了日程。这意味着Intel正式开始了新的Tick-Tock战略。2007年,Intel在Core架构的基础上进行了升级,推出了Penryn架构。其实心的Penryn架构依然是Core微架构中的一员,不过已经将工艺提升至了45nm,二级缓存容量扩大到6MB,并且加入了新的SSE4指令集。
45nm工艺Penryn架构代表作酷睿E8400
45nm工艺Penryn架构共推出两个核心版本,一个是双核版本的Wolfdale,定位酷睿E8000,另外一个是四核心版本的Yorkfield,定位酷睿E9X50。后者其实就是将两个Wolfdale封装一起的产品,二者之间并没有本质上的区别。在Wolfdale的基础上,Intel还推出了一些精简版本。如将缓存减少至3MB容量做成酷睿E7000系列,或者更进一步减少至2MB,前端总线降低至800MHz的奔腾双核E5000系列。这也就是为何会出现五颗电容且超频能力非常强悍E5200处理器的主要原因。
五电容版奔腾双核E5200处理器
45nm工艺酷睿处理器的超频能力普遍较高,曾经一度被普通用户所抛弃的超频概念再次回归。在搭配原厂散热器的情况下,一些45nm工艺酷睿处理器都可以将频率定在一个较高的水平上。可见新架构在功耗控制上做出的努力。
北桥制约着酷睿架构性能的发挥
从性能和功耗两个方面的表现来看,酷睿架构看似已经完美了。但Intel深刻的了解到,前端总线已经成为了制约处理器性能发挥的最大瓶颈。因为沿用了NetBurst时代的前端总线概念。受前端总线频率制约,酷睿架构在内存控制能力上始终要弱于AMD一些。也正是如此,AMD才能凭借老的K8架构与酷睿架构抗衡很长时间。虽然二者性能差距不小,但AMD还是凭借着超低价格挺了过来。如此看来,前端总线已经到了淘汰的边缘。
在酷睿架构时代,我们没能看到超线程技术的身影。这主要是Intel发现多线程的应用并没有达到预期的水平。此外因NetBurst架构性能的影响,超线程技术也并没有发挥出真正的实力。考虑再三Intel决定将这一技术从Core架构上拿了下来,等到一款性能达到一定高度时,再选择超线程技术的回归。总体而言,Core架构是一款非常成功的设计,让Intel重新夺回了性能王者的桂冠,同时也挽回了NetBurst架构表现不佳的面子。虽然目前的市场已经被Nehalem架构产品占据,但Core架构依然没有离去,作为LGA775接口的最后舞者。这一架构要到2011年结束时才正式离开舞台。从这一点来看,Core架构算得上是十分成功的。
2006年的双核大战激战正酣,竞争对手突然变换打法,将新产品酷睿投入了战场。这让AMD始料未及,立刻被对手打得人仰马翻。不得已只得将旗下的K8架构产品全线降价,用低价格迎战对手的高性能。此战法果然奏效,立刻就为AMD迎来了无数的掌声。可惜好景不长,对手也将新品的价格进行了下调,并且加速了产品的更新速度。这一下AMD真的是招架不住了,急需新的救兵前来帮忙。就在这种大背景下,被推迟了一次又一次的K10架构处理器诞生了。
K10架构采用了原生四核设计
K10架构可谓生不逢时,先是AMD因收购ATi陷入了资金短缺的困境中,而后是竞争对手连续发力,在K10发布的前不久,Intel正式发布了首款45nm工艺处理器酷睿QX9650。此时的AMD处理器因45nm工艺尚未完成,依然停留在65nm工艺时代。就在这种万事皆没有准备好的大背景下,K10肩负着帮助AMD翻盘的任务上了前线。这样来看AMD有些赶鸭子上架的感觉。
K10架构AMD启用了新的品牌Phenom(羿龙)
K10架构AMD启用了新的品牌Phenom(羿龙),并首次将三A平台概念引出。第一代3A平台代号蜘蛛。即K10架构处理器,7系列芯片组和ATI Radeon HD 3800系列显卡三大产品。
赶鸭子上架的K10架构相比K8架构还是有很多改进的。首先65nm工艺的K10架构是为原生四核而设计,所以并没有任何一款双核产品。之后的速龙7750/7850均是屏蔽两颗核心而来。新的架构还将K8架构的1*128 bit模式存储器控制器转换为了2*64 bit模式,也就是将储器控制器拆分成为了两个,将内存的控制能力进一步加强。此外HyperTransport总线也升级为3.0规格,总带宽提高到20.8GBps。共享三级缓存概念也是首次加入进处理器中,用以提高处理器的使用效率。由此看来,重大改进的K10架构足以打败Core架构了。
早期Phenom四核因为出现了Bug性能表现并不理想
然而理论归理论,现实归现实,早期的K10架构Phenom四核处理器因为出现了TLB错误,造成了处理器主频无法提高,从而严重影响了性能。据了解,有问题的B2核心Phenom处理器2.3GHz仅相当于解决问题后B3不仅处理器的2.0GHz性能。此外,因为工艺制程的原因,早期K10架构处理器的功耗也出现了严重问题。两个问题叠加在一起,让早期K10架构并不能打败Core。一直到了B3步进处理器的TLB错误解决,才勉强能与65nm工艺Core架构竞争。曾经令AMD扬眉吐气的至尊FX系列处理器也就此完结。
当然早期Phenom也不是没有优点。因为采用了与AM2通用的AM2+接口,用户完全不用更换主板就可以实现对新处理器的支持。所以可以做到零成本升级,在这一点上还是吸引了不少用户。此外,新提出的三核心概念也要比双核处理器更加吸引人。虽然在性能上有着严重问题。但不管怎样AMD还算是勉强抗住了Intel的攻势。
第一代K10架构处理器的高功耗,低效能和TLB错误令AMD很是头疼,虽然之后解决了最严重的TLB问题,但高功耗的帽子却一直没有被摘掉。恰在此时,AMD与IBM合力研发的45nm工艺还出现了问题。这一度让Intel酷睿成为了45nm市场中唯一的选择,也一度造成45nm酷睿的价格疯长。
2008年,AMD宣布45nm SOI配合沉浸式光刻技术有了重大突破,这意味着AMD也将迈向45nm工艺。随之2008年底,AMD首批45nm工艺Phenom II X4 940/920正式上市,从而打破了Intel的一家垄断。但这距离Intel拿出第一款45nm工艺处理器已经过了1年的时间。
45nm工艺Deneb核心
45nm工艺Phenom II处理器依然为K10架构设计,但在原有基础上进行了改进。将三级缓存容量提高到了6MB,同时整合了DDR2内存控制器与DDR3内存控制器,具备了对DDR3内存的支持能力。(首批Phenom II X4 940/920不支持DDR3内存)除此之外,还将65nm工艺中几乎废弃的Cool 'n Quiet技术再次进入,令CPU的功效比大幅攀升。
从完整45nm K10架构核心衍生而来的四核/三核/双核
按照AMD的计划,以四核处理器主打高端市场,然后使用屏蔽部分核心而来的三核心和双核心处理器主打主流和中低端市场。然而出乎官方的意料,主板芯片组中的ACC高级时钟校验功能意外的将本已经屏蔽的核心开启,让市场中的大部分三核/双核处理器变成了完整四核的Phenom II X4。这一下严重扰乱了市场秩序,令AMD大为吃惊。虽然曾以开核官方不质保来要求消费者不要开核,但消费者还是不屑一顾的投入了开核大军中。最后AMD官方对此也就不了了之了。
速龙II双核处理器
45nm工艺中,AMD还推出了原生双核产品。这就是定位低端的速龙 II X2系列处理器。因为采用了原生双核设计,因此失去了像三核和高端羿龙II双核那样的开核能力。不过凭借着低廉的价格。速龙II双核产品依然受到了市场的好评。
45nm工艺K10架构处理器的出现终于帮助AMD解决了市场问题。凭借着出色的性能表现和优秀的超频能力(当然还有开核破解的能力),Phenom II和Athlon II产品受到了不少消费者的欢迎。虽然此时Intel凭借新一代Nehalem架构已经完全掌握了1500元以上高性能市场份额,但AMD并没有因此被彻底击垮。所以在诞生了一系列的四核处理器之后,AMD将注意力转向了更为高端的六核。
45nm终极产品Thuban六核
在进入2010年后,AMD与Intel都将注意力转移到了高端六核身上。与Intel主打高性能不同。AMD的起步还是很低的,只要能够满足普通消费者的需求即可。于是K10架构的终极产品Thuban六核诞生了。这就是目前市场中的最廉价六核系列产品,Phenom II X6 1090T/1055T处理器。
AMD六核代表作Phenom II X6 1090T
Thuban六核其实只是在原有的四核基础上增加了两个核心而已。所以技术上并没有太大改动,三级缓存依然保持为6MB不变。不过新增加的Turbo Core功能还是较为有特点,它可以将处理器核心的主频按照应用程序需求进行提高,从而达到高性能的目的。不过因为K10架构在原本设计时并没有加入该项技术,所以后加入的Turbo Core功能与处理器并不大匹配。因此在实际使用当中并没有起到应有的作用。
Turbo Core技术价值在K10架构上并没有体现出来
K10架构并没有续写K8架构的辉煌,尤其是早期65nm工艺Phenom处理器更可以用惨淡经营来形容。虽然在后期45nm工艺推出之后为AMD挽回了一些颜面。但它始终没能帮助AMD重回巅峰状态。从2000元以上处理器彻底消失这一点便可以得到很好的证明。但不管怎样,消费者还是回记住K10架构的,虽然在性能上Phenom II处理器还存在争议,但低廉的价格,零成本的升级,以及免费赠送的核心(开核)都为消费者增添了不少欢乐。从这些角度来看,K10架构也是成功的。至少它是一款亲民的架构。
Core架构的成功并没有让Intel冲昏头脑,并且深刻的意识到了前端总线的弊端。为了摆脱前端总线对处理器性能的制约。Intel决定开发一款新的架构,这就是当前市场中拥有最高性能的Nehalem架构。从这一代架构的LGA1156平台开始,北桥也正式与主板Say Goodbye。
Nehalem架构具有相当的革命性意义
第一批上市的Nehalem架构处理器采用的是全新的LGA1366接口,让老平台用户失去了升级的可能性。该接口Nehalem架构处理器全部采用原生四核心设计,支持三通道内存,并采用了共享式8MB三级缓存,在工艺上并没有进行改进,而是继续沿用Tick-Tock战略使用45nm工艺。在指令集方面,Nehalem架构也进行了部分更新,新加入了SSE4.2指令集,加入了STTNI(字符串文本新指令)和ATA(面向应用的加速器)两大优化指令。
QPI总线改变了以往CPU到北桥再到内存的数据交换模式
为了摆脱前端总线的制约,LGA1366接口Nehalem架构处理器将本属于北桥的内存控制器转移到了处理器内,并且集成了三通道DDR3内存控制器,与内存进行数据交换的总线也更换为了QPI总线,数据带宽一下子被提升至了24-32GB/s,其性能提升可想而知。
睿频加速技术在Nehalem架构时代被提出
除了提升处理器的性能,Intel还对如何提升处理器核心的使用率下了一番功夫。为此还创造了一项全新的技术——睿频加速。通过睿频加速功能,处理器可以根据应用需要选择核心数量进行主频提升,同时对空闲的核心进行降频进入空闲状态。如此一来可以自动调整核心数量和主频高低,从而达到提高工作效率并且降低功耗的作用。该项作用的应用可以说将桌面级处理器带入了智能化时代。之后AMD在K10架构六核处理器上应用的Turbo Core技术便是受了睿频加速技术的启发而推出的。
在介绍Core架构部分我们曾经谈到过,Intel为了不影响Core架构处理器的性能,取消了在NetBurst架构时代的超线程技术。在进入Nehalem架构时代后。因处理器的性能已经达到了指标,且多线程应用优化也趋于完善,Intel将超线程技术再次引入。令Nehalem架构酷睿i7处理器一跃成为了8线程乃至12线程怪物,多核心性能被极致的发挥了出来。
超线程技术的引入令酷睿i7处理器的性能发挥到了极致
不过此时的Nehalem架构并不属于普通消费者,动辄上2000元的高价位可不是一般人能够消费的起的。加之AMD在45nm工艺上迟迟没有发力。因此Intel在拖了半年多以后才将普及型Nehalem架构处理器拿出。这就是目前市场中的大热门LGA1156平台。
Nehalem架构LGA1366/1156接口与LGA775接口处理器对比
2009年7月上市的第一批Nehalem架构处理器延续了LGA1366接口处理器的特性,原生四核设计,支持睿频加速技术,支持超线程技术(酷睿i5不支持),45nm工艺制造,SSE4.2指令集以及8MB三级缓存。但最大的不同是LGA1156接口处理器将北桥已经全部融入进了处理器当中,令主板功能进一步精简。从而也让Intel平台率先进入了双芯片时代。
整合北桥后Intel平台进入了双芯片时代
2009年LGA1156平台的Nehalem架构处理器被分为了两个级别,分别是高端的酷睿i7与定位中端的酷睿i5。两者最大的区别是酷睿i5没有提供超线程技术,且主频稍低一些。虽然在上市之初价格一度高达1500元以上,但凭借着出色的性能表现,酷睿i5依然赢得了消费者的欢迎。直至今日它也是市场中最受欢迎的一款高性能四核处理器。
定位高端的和定位中端的产品都有了,那么什么时候才有定位大众级的产品呢?因为LGA775平台的市场依然庞大,所以Intel并没有加快Nehalem架构的普及速度。采用对Core架构降价的策略来占领中低端市场。在运行了一年之后,Intel终于祭出了最终杀器。32nm工艺的Nehalem架构升级版Westmere架构。也就是当前市场中的32nm双核酷睿i3/i5和六核酷睿i7 980X处理器。
09年Intel展示了32nm工艺处理器
按照Intel的Tick-Tock战略,在架构更新完毕之后随之而来的是制程更新。Westmere架构也就是32nm工艺的Nehalem架构版本。但不一样的是Intel并没有推出四核心版本处理器,仅在最高端的六核和中低端的双核上进行了工艺更新。除此之外,所有的LGA1156接口32nm处理器都被整合进了一颗45nm工艺整合芯片。从此处理器也进入了整合时代。再此提醒读者朋友的是,整合时代绝非融合时代,一定要区分好二者的关系。
32nm工艺处理器最大的特点是双Die设计
32nm工艺处理器在LGA1156平台上推出了三款型号,分别是定位入门级的奔腾,大众消费级的酷睿i3,和定位中高端的酷睿i5。后两者除了酷睿i3不支持睿频加速技术外并无差别,同样支持超线程技术。奔腾处理器取消了睿频加速和超线程技术,同时将三级缓存也砍到了3MB。由于有四核酷睿i5处理器的影响,因此双核版的酷睿i5处理器并没有引起消费者的注意。酷睿i3处理器也因为受到了AMD的开核影响而没有达到预期的市场效果。
32nm六核处理器并非胶水货
在AMD的K8架构没落之后,*性能市场就剩下了Intel一人在跳舞。好在Intel没有被胜利冲昏了头脑。所以在*市场依然进行着快速更新。继推出酷睿i7 965/975这些*四核之后。Intel将注意力转向了更为高端的六核。在解决了工艺这一难题之后,全球首款桌面级六核处理器诞生了。这就是采用Wsetmere架构设计的酷睿i7 980X处理器。
酷睿i7 980X处理器集成了惊人的11.7亿个晶体管,共整合了12MB三级缓存,在超线程技术的支持下,线程支持能力达到了12个。如此强悍的一款处理器也没有像之前的酷睿2四核那样使用整合的方法而来。而是采用原生六核心设计,并且采用了Nehalem架构中的全部技术。如此高端的产品售价自然惊人,但即便如此酷睿i7 980X的市场依然不小,999美元依然有人买账。可见追求高性能的用户并不在乎价格多少。
编者留言:
写到这里,我们也回顾完了从2000年-2010年这11年的全部桌面级处理器架构。在他们当中虽然有着不尽如人意的地方,但每一代都是经典的。也正是处理器架构的发展推动着整个芯片产业的进步。由此看来无论是Intel还是AMD,又或者是与桌面级芯片毫不相干的其他芯片厂商,都是伟大的。正是有了他们的不屑努力,才让电子行业飞速的发展着。在此笔者也希望他们在未来能够为消费市场贡献出更为优秀,同时也更为廉价的产品,为科技的进步作出应有的贡献。