vPC增强特性

一、Peer-Switch

之前提到过,即使启用了vPC也需要将生成树作为Fail Safe方案。vPC开启的同时需要开启生成树(建议RPVST/MSTP),防止vPC升级、失效而出现的二层环路。vPC和生成树同时启用时,生成树端口的情况:


按照默认vPC配置,具有最低local system-mac的交换机当选为根桥。但是vPC处理BPDU报文时却是operational primary负责,operational primary会在Member Port和Peer Link上发送BPDU报文,而operational secondary则只会在非vPC Port生成BPDU报文(此时的Peer发送BPDU使用各自的local system-mac)。

如果根桥故障,那么二层网络肯定会重新收敛,流量就会中断,思科给出了收敛时间在3s,为了避免出现这种情况,思科通过增加peer-switch深化vPC特性,允许两台Peer实现单个根桥的虚拟化(简单说就是Peer都是根桥交换机,此时Peer发送BPDU使用vPC system-mac),即使任何一台Peer故障了,对下行交换机不产生影响,这使得重新收敛时间缩小到亚秒级。



二、Peer-Gateway

部分NAS(NETAPP Fast-Path或EMC IP-Reflect)、Load-Balance、应用服务器不遵守常规的ARP reply。

NAS发送ARP request请求VIP的vMAC,HSRP Active响应ARP reply,但是NAS只采用ARP reply中的src MAC而不采用Payload中的vMAC,如果报文被二层HASH到了Secondary,那么根据CAM查表转发,会扔到Peer Link链路上,触发vPC防环机制。

思科针对这些设备专门开发了一个特性Peer-Gateway。Peer-Gateway允许vPC对等设备直接L3转发。

三、ARP Sync

故障或升级场景时,Member Port和SVIs都会被suspend,ARP表,路由表被清空。当设备或者Peer Link恢复后,ARP表的恢复时间是重新收敛过程最大的时延之一,在这段时间内如果Member Port和SVIs up,那么就会导致短暂的流量黑洞。为了解决这个问题,使得故障恢复能够平滑切换流量,需要启用vPC ARP Sync,该功能启用后会在Member Ports和SVIs up前将ARP表项进行同步完成,以保证不会出现大量的非对称流量。为了解决路由收敛的问题,启用delay restore功能,该功能启用后会在Member Ports up前先将SVIs up,使得L3邻居先进行建立,学习完路由后再up Member Ports。

四、ISSU

vPC和ISSU(在线软件升级)/ISSD(在线软件降级)完全兼容,支持vPC 执行NX-OS升降级,不会产生任何丢包。可以在不中断业务的情况下实现系统的维护、升级和软件认证操作。