|
从奔腾到酷睿 解析Intel架构Core微架构所采用的数据预取技术毫无疑问是目前为止最先进的,旗下酷睿2处理器将系统性能推上了一个新的高度,并且其优秀的超频性能,也让无数DIY玩家为之疯狂。而Core微架构的成功并不会让Intel松懈,Intel会保持每一年更新现有微架构、每两年更换全新微架构的计划,预计2008年下半将会推全新45纳米NEHALEM微架构,2009年下半年则拥有32纳米更新版本,并改良了NEHALEM微架构的WESTMERE,2010年下半年全新微架构SANDY BRIDGE将紧接上场。而随着加强型Core微架构Penryn处理器即将上市,让我们看到了Intel遵循“摩尔定律”的决心与技术实力。以下我们就来简单的见证一下Intel处理器构架变化的过程,重新回忆起以前Intel所走过的路。 ● P5、P6架构 在486处理器时代,Intel、AMD和Cyrix的产品在性能方面并没有明显的差距,毕竟此时遵循的架构相同,而且主频一致,放在主板上的缓存也没有多大区别。在这样的背景下,Intel唯一的优势便是产能,AMD和Cyrix则继续紧跟巨人脚步。不过聪明的Intel并没有选择按部就班,通过一张专利授权证明,Pentium将AMD和Cyrix都挡在了门外。
Pentium采用P5架构,这被证明是伟大的创举。在Intel的发展历史中,第一代Pentium绝对是具有里程碑意义的产品,这一品牌甚至沿用至今,已经有十几年的历史了。尽管第一代Pentium 60的综合表现很一般,甚至不比486DX66强多少,但是当主频优势体现出来之后,此时所表现出来的威力令人震惊。Pentium 75、Pentium 100以及Pentium 133,经典的产品一度称雄业界。在同一时代,作为竞争对手的AMD和Cyrix显然因为架构上的落后而无法与Intel展开正面竞争,即便是号称“高频486”的Cyrix 5X86也差距甚大,这并非是高主频所能弥补的缺陷。 痛定思痛,AMD面对这样的局面只能另辟道路。经过K5还算成功的试探之后,又发布了K6处理器,并逐渐衍生出K6-2和K6-3。如果说第一代K6还只能与具备MMX技术的Pentium打成平手的话,那么后续的K6-2和K6-3则凭借架构上的优势令Intel感受到巨大的压力。为此,Intel将原本用于Pentium Pro服务器处理器的P6架构用于桌面处理器,并且这一架构沿用多年,直到Pentium III时代。
在Pentium时代,虽然Intel还是相对竞争对手保持一定的领先,但是Intel并未感到满足。在他们看来,只有从架构上扼杀对手,才能完全摆脱AMD和Cyrix两家的追赶。于是,Intel在发布奔腾的下一代产品Pentium II时,采用了专利保护的P6架构,并且不再向AMD和Cyrix授权。P6架构与Pentium的P5架构最大的不同在于,以前集成在主板上的二级缓存被移植到了CPU内,从而大大地加快了数据读取和命中率,提高了性能。AMD和Cyrix由于没能得到P6架构的授权,只好继续走在旧的架构上,整个CPU市场的格局一下子发生了巨大的变化,AMD和Cyrix的市场份额急剧下降。这里我们需要特别提一下K6-2+和K6-3,尽管这两款令人肃然起敬的产品也对Intel构成严重威胁,但是它们所谓的内置二级缓存并非集成在CPU核心中,因此绝对不能算作P6架构,浮点性能也有着不小的差距。
NetBurst是Intel沿用时间最长的一代构架,NetBurst架构的Pentium4在提高流水线长度之后令执行效率大幅度降低,此时大容量二级缓存与高主频才是真正的弥补方法。可是讽刺的是,频率比AthlonXP 2000+高出很多的Pentium4 Willamette 2GHz竟然服服帖帖地败于其下。尽管后续的NorthWood核心凭借512KB二级缓存略微挽回面子,但是当时AMD的K7架构也在发展,Barton核心将Intel陷入了被动。因此,我们可以给出这样一个明确的结论:Intel的NetBurst架构即便是面对AMD K7架构时也没有什么可骄傲的资本。如果不是Intel的市场调控能力超强,如今CPU市场的格局可能会是另一番景象。
● NetBurst构架特点: 1.较快的系统总线(Faster System Bus); 当2000年英特尔发布了Pentium 4处理器后,Intel来到了一个一统江湖的时代。尽管如今的Pentium4已经是众人皆知的产品,但是在其发展初期可并不是一帆风顺,第一代Willamette核心就饱受批评。对于全新的NetBurst结构而言,发挥强大的性能需要更高的主频以及强大的缓存结构,而这些都是Willamette核心所不具备的。起初P4处理器集成了4200万个晶体管,并设计有256KB二级缓存,此时的整体性能受到很大影响。然而最让Intel尴尬的是,Willamette核心的Pentium4 1.5G甚至不如Tualatin核心的Pentium III。Prescott核心依旧是NetBurst架构,并且高频率产品的综合性能还是实实在在的。但是明眼人都看到了Intel的软肋,NetBurst架构过分依赖于主频与缓存,这与当前CPU的发展趋势格格不入。为了提高主频,NetBurst架构不断延长CPU超流水线的级数。 当时由于巨大的缓存容量负担,不仅提高处理器成本,也令发热量骤升。如果不是Intel的市场公关与口碑较好,那么Intel处理器早就要陷入尴尬了,因为如今高频Pentium简直就是高发热量和高功耗的代名词。
对比Dothan核心的Pentium M与主流Pentium4,我们不难发现Intel的尴尬之处。从技术角度而言,Intel完全有能力推出比当前Pentium4性能更好的处理器,但是错误的架构选择令其陷入被动。业内有人质疑过:Pentium M的核心架构依然是P6,只不过结合了NetBurst架构的前端总线技术,通过减少原先P6微架构下指令编译后的微指令数目来改善指令编译器及处理单元的效能,并且主频和缓存都大幅度加强。 尽管我们一再认为AMD的K7架构十分先进,但是不可否认的是,K7架构基本上与P6架构相差不大。如果K7也配备大容量缓存与主频,那么其性能表现与Pentium M将是差不多的,这一点在多种测试中也得到证明。Intel显然是意识到在当前制作工艺受到限制并且CPU越来越要求低发热量的大背景下,CPU必须提高流水线效率。在仓促之间,Intel选择了P6架构来简单应付。只不过Intel的市场调控能力实在太出色,而相关技术的领先也帮助Pentium M站稳脚跟,为后来的迅驰产品奠定了坚实的基础。
既然NetBurst架构已经无法满足未来CPU发展的需要,那么Intel就必须开辟全新的CPU核心架构。事实上,Intel就早做好了技术准备,迅驰III中的Yonah移动处理器已经具备Core核心架构的技术精髓。Intel于前不久正式公布了全新的Core核心架构:未来台式机使用Conroe,笔记本使用Merom,服务器使用WoodCrest,这三款处理器全部基于Core核心架构。 Core微架构要优于Pentium 4和Athlon 64所采用的技术,其中的每个核心至少有3组预取单元,包括2组数据预取单元和1组指令预取单元。除此之外,共享式二级缓存还拥有2组预取单元。这样,在一个双核心的采用Core微架构的处理器中,共有8组预取单元。有一个问题是,多达8组的预取单元在进行预取工作时,很容易会妨碍到正在运行的程序的正常的load操作。为了避免这种情况的发生,Core微架构采取了预取监测器的机制,该监测器总会给予正在运行的程序更高的优先级。这样,预取单元就决不会从正在运行的程序那里“偷”走很多带宽了。
Core微架构的预取机制还有更多新特性。数据预取单元经常需要在缓存中进行标签查找。为了避免引起正在运行的程序进行的标签查找的更高的延迟,数据预取单元使用标签查找的store端口。如果你还记得,load 操作的发生频率是store操作的2倍之多,那么就容易理解这样的选择了——store 端口的使用频率仅为 load 端口的一半。并且,store操作在大多数情况下并不是影响系统性能的关键,因为在数据开始写入后,处理器可以马上开始进行下面的工作,而不必等待写入操作完成。缓存/内存子系统会负责数据的整个写入到缓存、复制到主内存的过程。
Core微架构的缓存系统也令人印象深刻。二级缓存容量高达4MB,并且是由两个核心共享的,访问延迟仅12到14个时钟周期。每个核心还拥有32KB的一级指令缓存和一级数据缓存,访问延迟仅仅3个时钟周期。从 NetBurst 微架构开始引入的追踪式缓存(Trace Cache)在Core微架构中消失了。NetBurst 微架构中的追踪式缓存的作用与常见的指令缓存相类似,是用来存放解码前的指令的,对 NetBurst 微架构的长流水线结构非常有用。而Core微架构回归相对较短的流水线之后,追踪式缓存也随之消失,因为Intel认为,传统的一级指令缓存对短流水线的Core微架构更加有用。 结语: 现在处理器的发展已经不是只强调计算速度,而是多方面的追求,如功耗、发热量等多方面的发展。可以说新一代Core构架的处理器是Intel朝高性能、低功耗、低发热量等方面的一个新的起点。相信,Intel处理器随着构架的不断更新,工艺的不断提高,其产品能改变人们的生活,满足消费者的需求。 【相关文章】 【责任编辑:常疆 TEL:(010)68476606】 责编: 微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友 著作权声明:kaiyun体育官方人口
文章著作权分属kaiyun体育官方人口
、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。 |
最新专题 推荐圈子 |
|