xSeries X3芯片技术亮点--远程目录和vL4高速缓存

2005/9/28 9:50:00【作者】Amteam.org

在启动具有多个节点的系统时,BIOS会在探听过滤器和远程目录之间分区48MbitseDRAM(划分比率可能是8:17:26:3等等)。这一分区已经根据系统的大小在BIOS中进行了硬编码;32处理器系统的节点间通信量明显地比8处理器的系统多,因此应该拥有一个更大的远程目录。这一分区操作将来有可能由用户进行控制,但是,很可能仅对HPC或者彻底了解应用程序扩展特征的应用程序用户本身有吸引力。远程目录会跟踪那些通过编址映射到主机内存、并由另一个节点检查的数据,它使用的格式与探听过滤器使用的格式相同。

在节点请求一个通过地址映射到远程节点上的内存的高速缓存行时(在错过本地处理器缓存和vL4后),源节点将发送一个传播探听到系统中其它的所有节点上。远程目录经过了巧妙的设计,仅仅支持单个节点通过数据向任何给定的探听传播响应。在节点接收另一个节点的请求且它的探听过滤器显示出高速缓存行的所有权时,数据会发送到请求节点。至多一个节点可以在它的探听过滤器中显示所有权。根据定义,特定请求的主节点(Home node)是请求的地址映射到该节点下的内存的节点。在关闭节点请求到达时,该主节点会与它的探听过滤器一起并行检查它的远程目录。如果远程目录显示,高速缓存行的所有权已经提供给另一个节点,则主节点不会返回数据。如果请求到达了探听过滤器,或者在远程目录中失去,则主节点会返回数据。

在多节点系统中,虚拟 L4高速缓存用于提高 X3的可扩展性。 在启动时, BIOS会留出一个单独的内存区,将其用作虚拟高速缓存。 尽管留出的内存量是硬编码的,它也可以由用户进行配置,供了解相关知识的用户使用(很可能又是 HPC用户)。 可扩展性控制器使用 vL4来存储非本地的、以前请求的高速缓存行(即高速缓存行在可扩展性控制器相对较遥远的地方)。 这提高了性能(因为 vL4服务的数据请求的解析速度比节点间数据请求快)并且确保了内存一致性(因为每个高速缓存行在内存中都有独一无二的位置)。 因此,在上面的图 中, NE quad将从它的 vL4(或者高速缓存本身)而不是内存中发送所请求的高速缓存行。
【打印】
查看完整文章| 频道首页| 网站首页
Baidu
map