数据中心内的数据流量及其支持的服务正在迅速增长。就Google而言,其数据中心的带宽需求每年大约翻番。为此,在硬件方面已经取得了很大的进步。交换机Tomahawk 4刚达到25.6兆位/秒。收发器技术最近又突破了400G。
到2021年,所有数据中心流量的大约95%将来自云端,并且在云应用中,大多数数据包都在500字节以下。随着尺寸变小,您需要更快地切换以匹配。不幸的是,网络仍在等待延迟方面挣扎。
随着数据中心系统的扩展,使用中的电子分组交换网络会遇到“长尾延迟”,通常会达到数百毫秒甚至更长,比中位数值延迟值高几个数量级。详细说来,正常情况下,每100名用户中有1名的等待时间达到峰值并不是问题,但是当1%的用户变成数千名用户时,这将成为一个真正的问题。
最近发布的名为PULSE的体系结构提供了创新的解决方案。本杰明(Benjamin)等人设计了一种由分布式硬件调度程序控制的光电路交换网络。在MATLAB上建模时,该架构的平均延迟约为1微秒,尾部延迟约为5微秒。当考虑到调整开销时,它的吞吐量是惊人的每秒25.6Pb,尽管瞬时节点到节点的限制是100Gbps。
这是通过网络的一些关键功能来完成的。使用了平行星形耦合器,它允许光线从任何端口均等地传输到所有其他连接的端口。每个机架有64个节点,总共有64个机架,每个节点都有多个收发器以方便子网。每个收发器都通过不同的星形耦合器将其节点连接到不同的子网。
在数据传输期间,发射器和接收器被调谐到相同的时隙和波长。因此,对于每个耦合器,在同一机架中都有一个对应的节点调度程序,用于处理源-目标机架对。此外,请求会提前几个时期(周期持续时间)发送到调度程序。创新的调度算法为每个电路周期计算一个新的波长。该架构的关键特征是其纳秒级电路的重新配置速度。
由于子网是完全独立的,因此这种独特的设置允许重复使用波长。结果,该网络可以支持超过25万个频道。此外,该系统允许100%的波长使用。此架构不需要缓冲、寻址和网络内交换。但是,它确实需要极快的过滤、调度、数据恢复、可调波长切换和同步。在这种布局下,节点可以有效地共享资源,并使瓶颈最小化。
令人惊讶的发现之一是,相对于当前的网络架构,其成本约为5美元 / Gbps,实际上具有很高的成本效益。为此,该网络每位仅消耗82皮焦耳。收发器的成本在下降,这将进一步使PULSE等系统受益。此外,在数据中心刷新周期内,仅需要升级终端节点收发器,从而可以节省更多成本。 |