2.1 交换机 CSS2 技术 2.1.1 基本概念 CSS2 集群角色 l 主交换机/集群主 :经过集群竞争后,角色为主的交换机。管理整个集群系统,集群系统中只有一台主交换机。主交换机负责分配集群成员ID,收集集群拓扑信息, 并将拓扑信息通告给所有集群成员。 l 备交换机/集群备 :经过集群竞争后,角色为备的交换机,是主交换机的备份交换机,当主交换机发生故障,备交换机接管主交换机的所有业务。 l 系统主 :集群主上的主用主控板,作为集群系统的主。 l 系统备 :集群备上的主用主控板,作为集群系统的备。 l 框主 :单框上的主用主控板。 l 框备 :单框上的备用主控板。 l 冷备板 :集群系统中暂不参与控制面的主控板。 l 交换网硬件集群卡 :交换网板上插入的用于构建集群的接口卡说明图示:
系统主冷备板
系统备冷备板
主交换机 /集群主 备交换机 /集群备
2.1.2 CSS2 集群线缆连接
图2-1CSS2 设备角色说明
集群成员交换机通过连接交换网板上的集群卡接口形成集群。当前 S12700 每块交换网上可以插一块 EH1D2VS08000 集群卡,每块集群卡上出 8 个 10GE集群接口。当使用集群卡与对框的任一交换网集群卡进行集群连接时,建议采用按照面板接口顺序的方式一对一进行连接。
图2-2EH1D2VS08000 集群卡面板图
连线说明: l 任意连接一个接口即可建立集群 l 从冗余可靠性角度,建议每机框至少使用两块集群卡。为保证带宽,建议全连接。 l 不支撑 1 块集群子卡连接多块集群子卡,如下图为错误连接
2.1.3 CSS2 集群建立
图2-4S12700 错误连接示意图
集群系统的交换机在使用集群线缆连接好且已使能集群功能的情况下,上电时集群系统会自动建立。通过竞争,一台成为集群主交换机、另一台成为集群备交换机。 主交换机按照如下方式选择: l 最先完成启动,并进入单框集群运行状态(单台设备已使能集群功能)的交换机成为主交换机。 l 当设备同时完成启动时,集群优先级高的设备成为主交换机。 l 当设备同时完成启动,并且集群优先级又相同时,MAC 地址小的成为主交换机。 集群系统建立之前,每台交换机都是单独的实体,每台交换机有自己独立的 IP 地址,对外体现为多台交换机,用户需要管理所有的设备;集群建立后集群成员对外体现为一个统一的逻辑实体,用户使用一个 IP 地址对集群中的所有交换机进行管理和维护。集群系统的 IP 地址和 MAC地址为集群系统首次建立时,集群主交换机的 IP 地址和 MAC地址。集群系统中的所有单板都向系统主用主控板注册,注册后以系统主用主控板上的配置文件进行配置恢复。
2.1.4 CSS2 集群合并
图2-5CSS2 集群建立
稳态运行的两个单框集群系统合并成一个新的两框集群系统,两个框将自动选出一个更优的作为集群主。其中一个集群主系统的配置不变,集群主上的业务也不会受到影响,集群主的备板将重启;而集群备的单框将整框重新启动,以集群备的角色加入框主的集群系统(两集群 ID 相同时,两集群系统无法合并),并同步主交换机的配置。
图2-6 CSS2 集群合并
2.1.5 CSS2 主备倒换 集群主内的两块主控板发生倒换 l 集群备升为集群主,原来的系统备升为系统主 l 集群主降为集群备 l 原来集群主框内的备用主控板升为 CSS2 的系统备
图2-7 CSS2 主备倒换集群备内的两块主控板发生倒换: l 集群主和集群备设备的角色不会发生变化 l 集群备内的备用主控板升为系统的备 2.1.6 CSS2 集群分裂 集群系统建立后,系统主用主控板和系统备用主控板定时发送心跳报文来维护集群系统的状态。集群电缆、集群卡或主控板等发生故障可能会导致两台交换机之间失去通信,导致两台交换机之间的心跳报文超时,此时集群系统将分裂为两台独立的交换机。 = +
图2-8CSS2 集群分裂 集群系统分裂后,若两台交换机都在正常运行,其全局配置完全相同,会以相同的 IP 地址、MAC地址和网络中的其他设备交互,导致 IP 地址和 MAC 地址冲突,引起整个网络故障。为避免此种场景的发生,可通过多主检测 MAD(Multi-Active Detect)协议,实现集群分裂的检测、冲突处理,降低集群分裂对业务的影响。
图2-9 CSS2 集群分裂交互 2.1.7 CSS2 系统分裂后地址冲突检查 集群的 IP 地址和 MAC 地址是全局的概念,整个集群的交换机都使用同一个 IP 地址和 MAC 地址。在网络运行中,一个集群分裂时,将导致 IP地址、和 MAC 地址冲突,所以在集群发生分裂后,必须进行二、三层的冲突检测。 多主检测 MAD(Multi-active Detection),是一种冲突检测和处理协议。链路故障导致集群系统分裂后,用于检测网络中是否存在两台以相同配置运行的交换机,即是否存在双主,并进行处理。如果配置了 MAD 功能的集群系统分裂,检测到存在双主,则根据接收到的 MAD报文中所携带的信息判断本机为主交换机还是备交换机。判断为备交换机除 MAD 检测接口外的其他接口将被关闭。 l 直连检测方式
集群系统正常运行状态下,为了减轻 CPU 负担,不发送 MAD报文;集群系统分裂后, 集群成员交换机通过检测链路以 1s 为周期发送 MAD报文,集群成员交换机接收到 MAD 报文,则判定出现双主。
Switch A
Switch B
MAD Link Cluster Link 图2-10 MAD 直连检测 l Relay 代理检测方式 集群分裂后,两台交换机会在检测链路上相互发送MAD 竞争报文。如果本交换机竞争为主,则不做处理,保持 Active 状态,正常转发业务报文;如果本交换机竞争为备,则需要关闭除保留端口外的所有业务端口,转入 Recovery 状态,停止转发业务报文。集群链路故障修复后,处于 Recovery 状态的交换机将重新启动,同时将被关闭的业务端口恢复 Up,整个集群系统恢复。
Switch A
Switch B
Cluster Link 图2-11MAD Relay 代理检测 2.1.8 LAG 口本地优先转发 由于集群跨框带宽有限,为了提高转发效率,减少跨框转发流量,需要支撑流量优先本地转发。即从本框进入的流量,优先通过本框相应的接口转发出去;如果本框相应的端口故障,那么从跨框的端口转发出去。默认支撑本地优先转发。
集群线缆
2.1.9 CSS2 报文转发原理
图2-12LAG 本地优先转发
CSS2 报文转发是转发、交换分离的架构。集群系统中的接口板进行二/三层报文转发, 当得到的出接口为非本单板,则进入交换网交换。该过程是一个纯粹内部的实现,对外界是完全屏蔽的,如对于三层报文来说,不管它在集群系统内部穿过了多少成员设备,在跳数上只增加 1,即表现为只经过了一个网络设备。 数据报文跨框单播转发流程: l 在上行单板查找到出接口,进入本框交换流程 l 本框交换网板进行交换,报文到对框交换网板 l 对框交换网板进行二次交换,报文到目的单板 l 目的单板进行报文转发
图2-13 单播报文转发组播/广播数据报文跨框转发流程: l 在上行单板进行组播表项转发,进行组播/广播复制,复制一份进入本框交换网。 l 本框交换网板进行交换网复制,复制到本框单板与对框交换网。 l 对框交换网板进行组播/广播复制,复制到多个目的单板。 l 目的单板进行组播/广播报文本板复制。
|