|
AMD“上海”处理器的新特性深度剖析AMD:从巴塞罗那到上海 近几年AMD在四核心处理器的道路上有着非常坎坷的经历。最初的“Barcelona”巴塞罗那处理器由于受到时钟频率和性能的制约无法满足业界对它的预期,在加上一些致命的Bug漏洞,迫使AMD几乎停止了这款处理器的出货。当我们苦苦等待的修订版重新上市的时候,AMD又要面对Intel巨大的竞争态势。Intel基于45nm制造工艺技术的“Harpertown”核心Xeon至强处理器成为了AMD可怕的敌人,新款至强处理器大大改善了性能功耗之比,在服务器市场中,疯狂的蚕食着本属于Opteron的市场份额。 不过AMD也并非吴下阿蒙,它也在努力寻找着扭转命运的契机。设计一款全新的四核心Opteron处理器的计划被提出,它就是传说中研发代号为“shanghai”的新一代核心架构。同时,它也会采用全新的45nm制造工艺技术。这有助于大幅提高处理器的时钟速度和性能功耗之比。shanghai也有许多新的改进,相较巴塞罗那,它算是第二代全新设计的处理器。在高效的巴塞罗那核心的基础之上,设计师可以更充分的优化性能,充分挖掘这一代处理器的潜能。全新的Opteron处理器将会有更高的时钟频率,每个时钟周期内可以处理更多指令,并且它的功耗也会更低。 基于全新的shanghai核心的Opteron处理器,究竟能否与Intel最新的Xeon处理器相抗衡呢,在这篇评测中,你将会了解到许多关于Shanghai处理器的新特性。 shanghai服务器堆栈
AMD处理器的五个时代 AMD的处理器发展是经历了漫长的演化阶段,目前最新的shanghai处理器已经算是K10.5代的产品。要想真正了解shanghai在AMD处理器大家族的地位,我们先来简要回顾一下AMD处理器的五个发展阶段。 第一代 80486至K6时代。初期的产品策略主要是以较低廉的产品价格为诉求,虽然最高性能不如同期的Intel产品,但却拥有较佳的价格性能比。 第二代 K7时代。K7的性能尤其是在浮点运算能力方面,受到不少DIY用户的欢迎。由于相对于Intel,AMD对于CPU的倍频锁定限制较松,因此广受许多超频用户的欢迎。但也由于缺乏过热保护,超频过度的K7系列CPU有较高的烧毁风险,导致部分消费者对其稳定度的信心偏低。 第三代 K8时代。由于率先于Intel之前优先投入64位CPU的市场,使得AMD在64位CPU的领域有比较早发展的优势,此时代的AMD产品仍采取了一贯的低主频高性能策略,解决因为电气性能有限导致CPU不稳定和发热量、耗电功率过大的问题,并导入使用IBM开发的SOI技术,使得K8相较同期Intel公司的P4处理器相同性能上有较低的功耗。 第四代 K10时代,由于原生四核心的设计复杂,加上电路设计Bug。导致AMD初期B2核心步进的Opteron(Barcelon)和Phenom(Agena)效能不彰,频率提升困难。为此AMD特别发布解决B2核心步进BUG的Patch,名称为“TLB Patch”。AMD接下来还将发布解决TLB Bug问题的B3核心步进,可使AMD K10处理器的整体效能再提升15%。 第五代 K10.5时代,AMD在2007年5月已完成45nm的SRAM晶圆生产,10月宣布45nm的处理器开始试产。AMD的45nm处理器在德国德累斯顿300mm晶圆厂Fab 36生产,生产工艺由AMD与IBM合作开发。譬如沉浸平版印刷术、AMD第四代SOI、Ultra-Low-K等,与Intel的有所不同。AMD认为,即使没有High-K、金属栅极技术也能顺利步入45nm时代,并不是必要的,不过到了32nm就是必需的了。此番展示的处理器包括服务器版本“Shanghai”和桌面版本“Deneb”,均为高端四核心型号。AMD将在今年10月正式发布45nm处理器,首先推出的是“Shanghai”,接下来将推出6核心 Opteron ,代号“Istanbul”,仍使用Socket F脚位,明年上半年推出AMD第三代Opteron平台,改用Socket G34脚位,推出代号“San Paulo”的6核心 Opteron,将支持DDR3内存与HyperTransport3.0协定,还会推出12核心 Opteron,代号为“Magny-Cours”。 Smart Fetch智能预取节电技术 相比之下,有些出现在shanghai中的新技术名词就要难理解的多。例如,Smart Fetch智能预取技术。虽然这项技术听上去,更像是能加快系统某些处理效能的技术,但事实上,它的主要功能是采用较为变通的方式来节省电能。众所周知,AMD的高速缓存层级架构,都是采用独立设计的,也就是说,较低级别的高速缓存,不会将全部的内容都复制到更高级的高速缓存,或者是其他高速缓存中。在shanghai处理器中,独立高速缓存的各种层级架构的总和足有8MB之多。但是为了达到节能降耗的目的,这些高速缓存并不总是全部都被开启。例如在巴塞罗那核心中,一个完全闲置的处理核心会持续的工作,但是它的频率会被降低,这样可以保证其内部的高速缓存是激活状态的,并且其他处理核心可以访问这中间的数据。在shanghai处理器中,L1、L2和L3高速缓存可以用来独立存储数据,这样处理核心就可以完全被关闭。基本上它的时钟频率可以降低为零。AMD生成这项技术可以降低处理器的功耗达21%。不过至少要有1个处理核心在系统中运作,保持着激活状态。但是,如果你的系统中,有四路shanghai处理器,那么在服务器空闲的时候,只有一个处理器的一个核心在工作,将会非常节电。虽然shanghai处理器中智能预取机制的节电效果,并没有Nehalem平台中的电源管理单元那么强悍,但是它仍然要比上一代巴塞罗那有较为明显的技术改进。 在shanghai中改进的不仅仅是层级缓存架构,整个存储体系也开始支持嵌套页表,这项技术可以加速在虚拟化软件中,内存地址的转换效率。shanghai的基本配置与巴塞罗那相当,但是AMD声称shanghai的切换速度要提高了25%之多。这就意味着基于shanghai的虚拟化平台中,从客户端模式到管理程序模式的转化将更为迅速。在客户端可以明显感到速度的提升。AMD在进行虚拟化测试时,运行过两个测试,一个是将客户端转换为管理程序,另一个是将管理程序转换为客户端。在这个转换的过程中,巴塞罗那使用了1360个周期,而shanghai仅仅使用了900个周期。目前的虚拟化软件已经开始支持AMD的shanghai处理器新特性“AMD-V”,这使得虚拟化服务器的性能得到了明显的改善。 事实上,VMware公司已经公布了一些shanghai处理器的性能数据,在VMware ESX 3.5中,基于硬件级别的嵌套页表要比软件模拟的嵌套页表性能高很多。 双路Opteron系统,支持16GB容量的DDR2-800内存 除此之外,shanghai还有不少让人兴奋的改进之处,shanghai内部集成的内存控制器开始正式支持DDR2 667至800MHz的频率。另外对于HyperTransport 3总线规范的支持也是迫在眉睫。第一批shanghai处理器并不支持HyperTransport 3总线。主要原因是AMD并没有想过在shanghai中引进,AMD在等待HyperTransport 3总线草案变成正式版。预计在明年春天Opteron有望开始正式支持HT3总线。届时处理器与处理器之间的通信带宽将激增一倍。HT3总线的速度会高达2.2GHz,最大双向合计带宽会达到可怕的17.6Gb/s。在2009年发布的Fiorano平台将会完全支持HT3系统总线。
价格和供货情况 shanghai核心的处理器如此令人期待,而它的价格和供货情况也不可小视。这是shanghai成败的关键。目前AMD已经公布了Opteron的各种型号和价格,请详见下面的表格,最终上市的产品价格只会比这些预发布的价格要低。
上述表格中所有处理器是目前已经确认的型号,而HE版低功耗阶层的处理器和SE版shanghai核心的衍生处理器目前尚不清楚具体的规格。不过AMD透露HE和SE版本的处理器的设计功耗为55W和105W。在明年第一季度上市。另外还有性能更强劲的处理器蓄势待发,SE版本的处理器会达到3GHz的频率,只是具体的上市时间AMD并未透露。 CPU-z检测信息 四路处理器系统,共计16个处理核心
Opteron是美国AMD公司首款K8系列微处理器,于2003年4月22日推出,其中文官方名称为“皓龙”,它也是首款与AMD64架构相容的。Opteron处理器主要用于服务器上,与英特尔的Xeon(至强)处理器竞争。 2007年9月10日,AMD推出首批采用K10微架构,核心代号Barcelona的Opteron 2300及8300系列B2步进处理器,全数均采用原生四核心设计及65nm SOI制程。 2008年3月1日,AMD正式出货B3步进制程Barcelona处理器,解决了B2步进制程的TLB Bug。HP、IBM、DELL将推出采用B3步进制程的Barcelona处理器的高效能服务器。 2008年3月,德国汉诺威电脑展Cebit 2008,AMD正式展出K10.5核心架构,代号为“Shanghai”(上海)的处理器,OEM厂商对此一新架构处理器效能感到满意。该处理器针对IPC(每一时脉周期指令)进行改进,并且将L3快取加大至6MB。 2008年5月25日,IBM为美国国家核能安全管理部打造一台代号为走鹃(Geococcyx californianus)的超级电脑,当中即采用6192颗AMD Opteron处理器与12960颗PowerX Cell 8i处理器搭配,计算峰值高达1.026PetaFLOPS,目前高居世界500强超级电脑的第一位。 2008年7月25日,AMD计划推出12核心的Opteron处理器,并升级为Socket G34插槽搭配Maranello服务器平台。最新的Socket G34插槽将有1974脚位,比目前Socket F的1207脚位Opteron处理器,性能最多可以提升64%,12核心的Opteron处理器预计2010年面世,届时将支援DDR3内存与4路HyperTransport3.0协定,到时AMD将推出45nm制程的12核心Magny Cours和同样采用45纳米制程的6核心Sao Paulo。AMD另外计划在明年下半年为现有的服务器平台推出6核心的Opteron处理器。 2008年7月28日,中央电视台引进1千多台内含AMD Opteron四核心的双路服务器,提供550Kbps编码的北京2008运动会赛事实况转播。1千多台内含Opteron四核心的双路服务器将分别用于前端服务器、串流媒体服务器、数据库服务器、二级媒体内容转发服务器、节目编码服务器。 2008年7月29日,AMD Opteron四核心处理器在双路、四路服务器创造了SPEC Web2005两项新的世界纪录。惠普ProLiant DL385 G5服务器配置了两颗四核心的Opteron 2356 2.3GHz,SPEC Web2005得分30007,而惠普ProLiant DL585 G5服务器配置了四颗四核心的Opteron 8356 2.3GHz,SPEC Web2005得分高达43854,比之前的记录提高了大约2.5%。另外四路Opteron 8356也首次使用10Gbps 以太网路进行测试,展示了Opteron直连架构的优异性能。 2008年8月11日,搭载AMD Opteron四核心处理器2360 SE 型号的惠普ProLiant DL785 G5服务器在TPC-H@300 GB 决策支持测试中取得突破世界纪录的成绩,另外也在SAP? Sales 和 Distribution Standard Application Benchmark双重测试中,在配置和工作负载相似的8颗Opteron 处理器共32颗核心的x86服务器中,荣获第一名。 大陆北京天文馆即将上映的 8000 x 8000 高清晰电影将使用30台8路的 Sun 服务器进行集体渲染,这些 Sun 服务器一共内含160颗AMD Opteron处理器。 AMD 45nm Opteron将在2008年年底上市,并同时推出服务器芯片组,命名为AMD SR5600,不再单纯依赖nVIDIA与Broadcom等第三方厂商提供芯片组。45nm Opteron将推出9种不同型号,时脉自2.3GHz~2.7GHz不等,采用Socket F脚位、6MB L2快取、TDP一律75w,但HyperTransport仍将采用2.0版本。 shanghai处理器芯片晶圆
Fiorano平台具有良好的扩展升级性,从2P到4P再到8P,系统都可以平滑升级。上面这张图表示四路Opteron处理器的架构图,整个系统仍然有希望再扩充为8P的系统。另一个值得注意的地方,它并不支持DDR3内存。尽管在桌面领域Phenom II处理器可以在2009年早期就可以支持DDR3内存技术,但是服务器级别的Opteron处理器就没有这么幸运了。由于受限于Socket插槽的兼容性问题,至少要等到2010年,AMD才会在Opteron处理器平台中使用全新的Socket插槽。因此在2010年之前,我们很难看到支持DDR3的Opteron平台问世。 在2009年年底的时候,Opteron皓龙处理器会衍生出6核心的版本,它的研发代号为Istanbul。它采用45nm制造工艺技术,看上去与目前的shanghai处理器非常类似。但是,它会额外的增加2个处理核心。依旧板载6MB容量的L3高速缓存。内部集成DDR2内存控制器,支持HT3系统总线。当然在这期间Intel也会有自己的产品路线图,基于Nehalem架构的四核心、八核心Xeon至强处理器也会相继到来。究竟鹿死谁手还要看高端服务器市场的反应。 Istanbul看上去与shanghai核心非常相似,只是多了2个处理核心 AMD计划在2010年,采用一种全新的G34处理器插槽,它会是首个长方形的Socket插槽。届时处理器将会有更为密集而庞大的引脚数量。预计将应用在下一代Opteron处理器上。令人兴奋的是,Opteron将集成真正的DDR3内存控制器,同时DDR3内存的通道数量将达到4路。此外,北桥芯片中HT3系统总线的链接数量也要由现在的3条,进化为4条。这些强悍的配置都会应用于4路处理器系统中。 尽管AMD一直尽力保证处理器插槽的向下兼容性,但是这次升级物理改动的地方相当大。全新一代处理器平台的研发代号为Maranello法拉利,为了保证多路处理器系统中有足够的数据传输带宽。法拉利平台中将使用2颗Fiorano中的主板逻辑核心。
未来的Opteron皓龙处理器平台 全新的处理器平台,将会有两个不同的阶层,Sao Paulo圣保罗,他拥有6个处理核心和6MB的L3高速缓存。而研发代号Magny Cours马尼库尔的处理器将具备高达12个处理核心和12MB容量的L3高速缓存。目前我们尚不知晓AMD是如何将众多的处理核心和缓存都集成在一个小小的芯片中的。不过可以肯定Magny Cours仍然会采用同shanghai处理器一样的45nm制造工艺技术生产。同时它的高速缓存层级架构也与传统的Opteron处理器保持一致。不过L3中的缓存架构则稍有不同。AMD在L3中加入了额外的智能控制芯片。它会以探针过滤器,或窥探过滤器的形式工作。在多路多核心处理器系统中,它可以有效的管理高速L3缓存中数据信息的相关性。这种设计与Nehalme中的片上功耗管理单元相类似。它可以控制处理核心的速度,降低他们的电压,同时还能监测处理器的热量。 除了上述一些AMD未来的处理特性细节之外,AMD今后的处理器产品还是比较扑朔迷离的。我们知道,在前不久AMD宣布卖掉自己的晶圆制造工厂,转而去依靠技术更为先进的晶圆代工公司生产处理器产品。 而在2010年上半年,AMD有计划推出两个高级的32nm制造工艺技术。首先在2010年中期,推出高性能的32nm制造工艺技术,一个是高性能的SOI硅绝缘工艺技术,high-k金属门电路的低功耗加工工艺技术。 据我们所知,AMD正在致力于下一代CPU架构的研发工作,它的代号为Bulldozer推土机。根据先前的报道,推土机可能使用45nm制造工艺技术。不过根据小编我的分析,如果推土机架构能在2011年到来面向桌面处理器市场,那么它很有可能会采用更为高级的32nn制造工艺技术。 【相关文章】 shanghai 4S server 【责任编辑:布丁 TEL:(010)68476606】 责编: 微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友 著作权声明:kaiyun体育官方人口
文章著作权分属kaiyun体育官方人口
、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。 |
最新专题 推荐圈子 |
|