IT标准化和商品化的后果之一是谷歌的数据中心是计算机对世界的看法。在所有计资源中,包括CPU,内存,存储都是可替代的。无论独立的位置,还是配件它们是可以互换的。未来,PC将失去失去主导地位,仅仅成为IT服务的一部分。

▲数据中心网络架构图
访问失败已经是商业数据中心的最糟糕表现,引起这个问题的原因源于现在的网络结构状态上更容易搭配。MapReduce的著名代码也正因为如此而存储到各个节点。
网络环境的变更和假设条件的改变,将驱动软件基础架构驱动的更改。这将促进将数据存储在任何地方,并让移动计算转移到你希望的任何地方。该数据中心将成为云端计算机。
在主机端,拥有运行在PCI-Express 3.0上的x8插槽的传输速度能够在双向提供8GB/sec(即字节)的带宽,这样我们有足够的IO资源利用核心包。在未来的系统单晶片架构,集成网卡到CPU中,将有可能甚至更快的速度。现在我们一个完全独立的问题:为什么我们仍在使用TCP协议,造成拥挤的数据通过在数据中心操作系统的堆栈。
接下来的难题是,如何使网络工作。带宽重生的关键是微软的MinuteSort FDS(Flat Datacenter Storage),它展示了如何在一个网络中足够的平均分配网络中的每一台计算机全速发送数据,它允许将数据存储在远程的每一台计算机,这意味着FDS不会由有在本地存储了。
对等带宽到底是什么?就像画一条线平分了整个网络带宽,一侧上的服务器可以与另一侧上服务器进行通信的通信速率。有足够的平分带宽的任何服务器可以与任何其他服务器的完整的网络速度。
为什么我们不是很好的对等网络带宽么?我们通常有发送,而不是东西南北交通网络优化。我们经常做一些网络优化,从横向到纵向。纵向意味着你的服务器是跟某个客户端在互联网上。横向是指你所谈论到另一台服务器的数据中心内。前云的软件架构主要是纵向沟通,客户在互联网之外。横向是后台云软件的功能是通过对话主要是为了彼此,只有少数卷须的大型集群。回想一下,谷歌如何倡导大量分列架构,它一个单一的网页可能需要1000个请求。大量分列架构的结构是新的常态。
我们都知道,数据中心网络没有跟上的软件体系结构的变化,但实际情况可能比我们知道的更糟。为了支持多为纵向的通信的能力,数据中心常使用了一个树型拓扑结构的核心,汇聚层和接入层。这个观点是,顶路由的网络有足够的带宽来处理所有流量,所有的机器的树中的。如果经济实力雄厚可以购买很多高层网络设备,如240-1。但如果你想谈论到数据中心中的一台机器中的其它部分的,这个选择是不明智的。
创建一个负担得起的对等带宽的网络,需要更周到的态度。基本的选项似乎是改变的协议,改变路由器,或者改变主机。微软想出的方法是,更改主机集中控制,并添加了一层。
VL2全面介绍:一个可扩展的,灵活的数据中心网络
一种实用的,可扩展的网络架构,以支持庞大的数据中心与服务器之间的服务之间的隔离性能,以太网第2层语义的统一的高容量。 VL2用途(1)平面寻址允许服务实例被放置在网络中的任何地方,(2)Valiant负载平衡,以分散交通均匀地分布网络路径,以及(3)基于终端系统的地址解析扩展到大型服务器池,不引入到网络控制面的复杂性。
总的想法是创建一个使用CLOS拓扑结构的扁平二层网络。虚拟机永远保持自己的IP地址,并且可以任意移动的数据中心。有关L2 ARP的广播问题的回避,通过改变ARP使用一个集中的登记服务,解决地址。没有更多的广播风暴。
这似乎很奇怪,但我参加过一次谈话热器VL2和做法是相当聪明,似乎是合理的。结果提供了低成本,高带宽,低延迟的现代软件架构所需要的东西流。有一个特点,这似乎是缺少的路线任何地方的vSwitch的类型方法。你不能只是覆盖在性能上的基本拓扑结构是不支持的。
现在你有这样的超级冷却数据中心的拓扑结构,你用它做什么呢?微软实现了一个版本的MinuteSort基准,3倍的速度比Hadoop的,排序的数据量的近3倍,约六分之一的硬件资源(1,033跨越250台机器与5624跨1406机器的磁盘)。
在微软FDS分布式存储系统上建立了基准代码
FDS总是在网络上发送数据。 FDS减轻了在两种方式中的数据传输成本。首先,我们给每个存储节点的网络带宽相匹配的存储带宽。 SAS磁盘的读取性能约120MByte/sec,或约1千兆位/秒,因此在我们的FDS集群存储节点总是至少有尽可能多的千兆位的网络带宽,因为它有磁盘配置的。第二,我们连接的存储节点,计算节点采用了全平分带宽的网络,特别是,CLOS网络拓扑结构,使用中的项目,如季风。这两个因素相结合,产生一种不拥挤的路径从远程磁盘到CPU,使系统的总I/ O带宽基本上等同于使用本地存储系统,如MapReduce的。是,当然,潜伏期成本。然而,FDS其性质允许任何计算节点访问任何数据具有同等的吞吐量。
VL2和FDS的方式和技术,如10/100 Gbps的网络上,我们已经取得了良好的进展,在CPU,RAM,可替代的资源池,数据中心内的存储。网络仍然是不可替代的,虽然我不知道那意味着。软件定义的网络将帮助网络成为第一类对象,这似乎接近,但出于性能方面的考虑,网络永远无法真正从下面的拓扑结构可以迎刃而解。
从这些发展中,我们能期待什么?互换性是一个真正的更深层次的商品化,我们希望看到对资源的破坏为基础的方法不对称,甚至更高级别的组织,更高水平的消费,开发新的最佳做法,甚至应该推动更高水平的自动化生态系统中的空间更激烈的竞争。