Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >新三网融合——计算存储与网络

新三网融合——计算存储与网络

作者头像
SDNLAB
发布于 2018-04-02 06:52:24
发布于 2018-04-02 06:52:24
2.1K0
举报
文章被收录于专栏:SDNLABSDNLAB

网络转发设备用于传输流量,不同类型的流量对网络的需求是不同的。数据中心中有三大类资源,计算、存储和网络,之前讲过的数据网络都是用来传输用户到用户的应用流量的,这类流量对于网络的容忍度比较高,丢包多一点、时延高一点或者抖动大一点都没什么关系,以太网+TCP/IP的协议栈基本上统治了数通网络领域,而这套协议栈用于存储资源间或者是计算资源间的通信却很不合适。存储业务对于丢包几乎是零容忍的(想想你存了一大笔钱,然而在银行数据库写存储时,账户上的数字少了个0会是个多大的灾难),而以太网和IP都是尽力而为的,传输控制需要依靠高层的TCP去做,这种端到端的重传和流控显然不能满足存储对丢包率的要求。同样,一些高性能计算(HPC,High Performance Computing)的业务对于时延几乎零容忍(如高频交易,导弹轨迹拟合等等),要求底层网络能够达到总线级的传输性能,因此尽力而为的以太网和IP同样难以支撑HPC流量的传输。

因此,数据中心中往往需要为计算、存储的流量专门布网,跑着特定的独立于以太网+TCP/IP的协议栈。对于HPC流量,通常使用IB网络(Infinite Band,无限带宽网络)进行高带宽、低时延的传输,对于存储流量,则通常使用FC网络(Fibre Channel,光纤通道网络)进行高带宽、无丢包的传输。下图给出了数据中心中业务网络组网的简化模型。

三张独立的网络往往意味着远超3倍的CAPEX/OPEX,整合势在必行。而三种网络的协议栈不同,要实现整合必须使用一个通用的承载协议。由于部署的广泛性的和丰富的整合经验(PPPOE,FRoE,IPoE),以太网成为了承载协议的理想选择。随着DCB(Data Center Bridge,802.1)协议集的发展,以太网的特性得到了相当的扩充—PFC(Priority Flow Control,802.1Qbb)提供了基于通道的无丢包机制,ETS(Enhanced Transmission Selection,802.1Qaz)提供了灵活的带宽调度机制,CN(Congestion Notification,802.1Qau)提供了路径拥塞通知机制。具备这些优良的特性,通过以太网来整合数据、存储网络已经成为了业界的普遍共识。至于IBoE(貌似还有人提过EoIB),目前还很不成熟,虽然很早美国就有人提请过专利(US8165138),不过相关产品和宣传都很少,作者对IB不是很了解,有兴趣的读者可以找一找这篇专利看一下。

这个专题我们就来讲一讲FCoE(Fibre Channel over Ethernet,ANSI T11),其演化思路是先整合接入层,再改造汇聚/核心层,以做到端到端的数据、存储整合,如下图所示。

1) FCoE

要了解FCoE,得先来看看FC长什么样子。FC是一套完整的协议栈,有着自己的物理层规范FC-0和FC-1。向上的FC-2P负责帧封装,并通过Buffer-to-Buffer Credit这种可靠传输机制来实现链路层面上的无丢包,功能上类似于TCP滑动窗口。存储节点通过HBA网卡支持FC,其中的FC端口被称为VN_port,每个VN_port都有一个24位的FC-3层地址FCID。FC中不需要进行链路层寻址,通信节点将以FCID作为源/目的地址,FC Switch间交互FSPF(Fibre Channel Shortest Path First,光纤通道最短路径优先)形成转发表,根据目的FCID进行寻址,所以说FC Switch在本质上是一台路由设备。FC-2M夹在FC-2P和FC-3两层之间,负责多个FCID地址的复用。

每个FC结点都有64位的WWN(Wold Wide Name),结点上的每个端口都有64位的WWPN(World Wide Port Name),对FC网络中的元素进行全球唯一的标识,相当于以太网中的MAC地址,只不过FC Switch并不用它来进行寻址。FC结点使用周知的FCID地址FFFFFE向Login Sever发送 FLOGI(Fabric Login,交换网登录)消息以自动获取FCID,这一过程类似于IP中的DHCP。FC获得FCID后要向地址为FFFFFC的Name Server发送PLOGI(Port Login,端口登录)消息,Name Server记录下WWN/WWPN和FCID的映射关系后回复确认消息。此时通信还不能直接开始,类似于TCP握手,源FC还需要通过PLOGI消息与对端进行FC-4层的协商,协商过后应用层才能开始进行通信。FC中也有类似于IP中DNS的名字解析机制,结点/端口命名可以使用基于字符串的Symbolic Port Name,Name Server中会记录Symbolic Port Name与FCID的映射关系,其他端口可以向Name Server查询已登录的端口信息。上述交互过程如下图所示。

可见,FC的通信过程与IP还是有着很多类似的机制的,最主要的区别是FC只使用FCID进行寻址,结点/端口标识WWN/WWPN并不出现在通信的数据帧中,这里的原因也很简单——64位的WWN/WWPN太长了,会影响FC的转发效率。将FC整合到以太网中,做法是使用Ethernet的帧头去代替FC-2,保留上层的FC-3和FC-4,FCOE协议栈和数据封装如下所示。这里提一句,FCoE将服务器的FC结点称为ENode,FCoE交换机称为FCF。

FCoE网络中,服务器通过一块CNA网卡同时支撑IP和FC-3两套协议,相当于HBA和Ethernet NIC的合体。FCoE的以太网类型是0x8906,其外层MAC地址的写法比较讲究,后续通过具体的通信流程进行介绍。外层的VLAN对于FCoE来说同样非常关键,其原因主要有二:首先,FCoE流量必须在无损无丢包的以太网链路上进行传输,这完全依赖于PFC和ETS机制,而这两种机制都需要根据VLAN标签来对流量进行分类,因此FCoE流量必须承载在特定的VLAN中;其次,FCF要实现存储网络内部的虚拟化,需要使用不同的VLAN来承载不同VSAN(Virtual Storage Area Network)的流量。那么外层以太网封装时具体该使用哪个VLAN呢?这就要看FCoE的控制平面了。

FCoE使用FIP(FCoE Initialization Protocol)作为控制平面协议,其以太网类型为0x8914。FIP主要负责以下三个工作:

✔ VLAN发现。FIP在Native VLAN中通过VLAN发现报文与邻居协商后续FIP信令和FCoE流量所使用的VLAN,其缺省值为1002。

✔ FCF发现。FCF在所有FCoE VLAN内定期组播发现通告报文,使得当前VLAN内的所有的ENode发现自己。

✔ FLOGI/PLOGI。与FC中相应过程一样,FCF作为Login Server为ENode分配FCID,同时作为Name Server记录ENode的登录信息。

经过上述三个阶段后,FCoE网络的初始化工作就完成了,FCoE流量得以无损地在以太网中传输。下面来看一个多跳FCoE网络中典型的报文转发流程。

由于FCF本质上是一台路由设备,因此FCoE报文经过FCF转发时FCID不变,而外层的MAC地址会逐跳地改写。我们知道IP和MAC是通过ARP协议联系在一起的,那么FCID和MAC该如何映射呢?FCoE为ENode规定了如下的映射方法:使用FC-MAP填充MAC地址的高24位,低24位填充为FCID,得到FPMA作为自己的以太网地址,而弃用CAN网卡出厂时的MAC地址。其中FC-MAP为FIP的FCF发现阶段中,FCF告诉ENode的信息,每个VSAN内部的ENode都使用相同的FC-MAP,不同的VSAN使用不同的FC-MAP。而对于FCF来说,不进行这种转换,直接使用本机MAC地址FCF-MAC进行外层以太网封装。同一个VSAN内的报文都在同一个VLAN内传输,FCF进行per VLAN的MAC地址学习,保证了VSAN间的隔离,不同VLAN的优先级不同,通过PFC和ETS进行差异化的传输控制。

单跳FCoE的转发更为简单一点,负责接入的FCF收到FCoE流量后,根据FCID进行寻址,然后直接转换成FC-2的帧格式在FC网络中进行传输,这里就不再画图说明了。

有一个问题就是,当服务器中部署虚拟机的时候,FCF不再是FCoE接入网络的第一跳,很多FIP的交互过程就实现不了,而FC网络也面临着这个问题。FC网络给出的解决办法是NPIV/NPV,NPIV部署在服务器中作为ENode和FCF之间的代理,为下挂的多个虚拟机ENode完成FLOGI/PLOGI过程,而NPV则将NPIV的功能放到了以太网交换机上。NPIV/NPV的示意图如下所示。同样地,FCoE也可以配合NPIV工作实现虚拟机的FCoE接入。Cisco 5k已经对FCoE提供了支持,但作者不清楚VN-TAG网卡跟NPIV是否已经做了集成,如果答案是确定的,那么VN-TAG相比于VEPA的优势可就不是一点半点了。

相比于之前讲到的其他技术领域,FCoE在数据中心IO整合这块基本上是一枝独秀,没有看到其它类似的有竞争力的技术,包括Cisco、Juniper、Broadcom、Huawei和H3C等都已经支持了FCoE,厂家们罕见的站在了同一个队伍中。可以说,FCoE的生态布局已经完成,未来几年应该也不会有谁能够撼动它的位子,FCoE今后的步子会越迈越大,以太网将对FC网络实现全面的收编。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2016-04-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 SDNLAB 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
转录组分析 | 使用STAR进行比对
前几期,小编已经教大家完成了RNA-seq数据的质控,下面就要正式开始转录组分析啦!
生信小王子
2020/08/10
4.2K0
转录组分析 | 使用STAR进行比对
生信软件 | STAR(测序序列与参考序列比对)
STAR 先搜索与参考基因组上,一个或多个位置完全匹配的最长序列。这些最长的匹配序列称为最大可映射前缀 (*Maximal Mappable Prefix,*MMP):
白墨石
2021/07/19
6.1K0
生信软件 | STAR(测序序列与参考序列比对)
癌症样本全转录组数据的融合基因鉴定
前几期转录组周更学习分享了lncRNA和mRNA联合分析的一般套路和鉴定新lncRNA的基本流程,接下来的两周我会带大家一起学习之前一位老师对癌症样本全转录组数据进行融合基因和变异鉴定的推文 老程的全转录组,解决遇到的各种问题
生信菜鸟团
2023/09/09
1K0
癌症样本全转录组数据的融合基因鉴定
比对软件STAR创建索引文件(index)
因为不连续的转录本结构,相对短的片段长度,和测序通量的不断提升,高通量RNA-seq数据的准确比对仍然是一个有挑战性且未解决的问题。当前可用的RNA-seq比对软件一般比对错误率较高,比对速度慢,受片段长度限制且比对偏差较大。STAR(Spliced Transcripts Alignments to a Reference,STAR)软件,使用了未压缩后缀阵列中的连续最大可比对种子搜索算法,接着对种子进行聚类和拼接。STAR在比对速度上胜过其他比对软件50多倍,在一个普通的12核服务器上,每小时比对5.5亿2 x 75 bp双端片段到人类基因组上,同时改进了比对敏感性和准确性。除了典型转录本外,STAR能够发现非典型剪切和嵌合(融合)转录本,并能够比对全长RNA序列。
生信交流平台
2020/10/23
10.7K0
STAR安装与使用
但是当我使用最新版本的STAR跑之前版本STAR建立的index时,遇到这样的报错:
生信编程日常
2020/10/29
5.3K0
STAR安装与使用
TCGA mRNA数据分析流程
TCGA mRNA定量分析流程测量HT-Seq 原始reads统计中的基因表达水平,Fragments per Kilobase of transcript per Million mapped reads(FPKM)和FPKM-UQ(上四分位标准化)。首先将reads与GRCh38 reference genome 参考基因组比对,然后通过量化比对的reads产生这些值。为了促进样品间归一化,所有RNA-Seq读数在分析过程中都被视为unstranded的状态.
生信交流平台
2022/09/21
1.6K0
TCGA mRNA数据分析流程
RNA-seq 检测变异之 GATK 最佳实践流程
RNA-seq 序列比对 对 RNA-seq 产出的数据进行变异检测分析,与常规重测序的主要区别就在序列比对这一步,因为 RNA-seq 的数据是来自转录本的,比对到参考基因组需要跨越转录剪切位点,所以 RNA-seq 进行变异检测的重点就在于跨剪切位点的精确序列比对。 文献 systematic evaluation of spliced alignment programs for RNA-seq data 中对 RNA-seq 数据常用的 11 款比对软件进行了详细测试,包括 STAR 2-pass,
生信技能树
2018/03/08
3.2K0
RNA-seq 检测变异之 GATK 最佳实践流程
从零到壹:10元~Mapping神器STAR的安装及用
STAR 天下武功唯快不破,STAR就是这样一个神器,人家mapping几个小时,STAR只要15分钟~~~~ 干货的流程 安装 如果你按照下面的教程已经获得了一台云服务器,那么按照如下操作进行。10元转录组分析:这次真的是干货了~灰常干 cd ~/binhttps://github.com/alexdobin/STAR/archive/2.5.3a.tar.gztar -xzf 2.5.3a.tar.gzcd STAR-2.5.3aln -s ~/bin/STAR-2.5.3a/bin/Linux_x8
Chris生命科学小站
2023/02/12
6570
单细胞转录组分析RNA velocity-STAR solo
STAR较CellRanger有着更快的运行速度和更广泛的运用场景。单细胞转录组的比对可以通过STAR-solo来实现,在solo Features 可以同时获取Gene expression和RNA velocity 信息,帮助我们进行拟时序分析。
旋转木马
2023/12/01
1.8K0
【免费】站长线下课:用STAR去Mapping~~~~
结合小站之前的教程这一步应该插在STAR Mapping之后从零到壹:10元~Mapping神器STAR的安装及用随便选一个样本,在样本文件夹里找到bam文件,然后用samtools index建立baibam与bai要在一个目录下,载入到IGV软件中,就是视频那个样子啦。位置信息是chr12:123,406,542-123,416,558首先看是不是链特异性,右键选color alignments by first-of-pair strand如视频那样,红蓝分布,就是链特异性再看是什么样的链特异性在链特异性那个样本右键选color alignments by read strand鼠标放在红或者蓝的read上,看信息。显示first of pair那个read的箭头方向与基因的方向相反,这就提示是dUTP建库的方法。知道这些有啥用呢?在STAR运行结束后的ReadsPerGene.out.tab文件中非链特异性的要选第二列那个数而dUTP链特异性建库要选第四列那个数所以批量处理counts数教程中"站长,Mapping之后counts怎么合并成一个表?"df.use <- data.frame(v1 = df.read 这句代码中V4就是第四列,选择这个是针对dUTP链特异性建库测序的,如果是非链特异性建库图中那个位置应该改成V2就可以啦~~
Chris生命科学小站
2023/03/02
5420
【免费】站长线下课:用STAR去Mapping~~~~
转录组 - 比对
生信技能树学习笔记 参考基因组准备 常用参考基因组 Ensembl asia.ensembl.org/index.html NCBI UCSC ## 进入参考基因组目录 mkdir -p $HOME/database/GRCh38.105 cd $HOME/database/GRCh38.105 ## 下载基因组 ## 一般选择primary assembly,没有的话可以选择toplevel nohup wget -c https://ftp.ensembl.org/pub/release-105/fa
用户10328045
2023/03/02
1.4K0
GATK RNA-Seq Snps Indel 分析
这是GATK Best Practice系列学习文章中的一篇,本文尝试使用: Gatk RNA -Seq Germline spns-indels Pipeline 来分析鼻咽癌(NPT) 分析流程如
SliverWorkspace
2020/09/21
1.8K0
GATK RNA-Seq Snps Indel 分析
转录组数据分析-比对
Ensembl:www.ensembl.org #用得最多数据库完善有基因对应的ID
用户10412487
2023/05/09
6820
“站长,要分析RNA-seq需要准备什么软件?
安装SRA tools Linux环境下按照以下步骤怎样获得一个自己的服务器请看以下教程“站长,没钱买高配置电脑咋做转录组分析?” 下载SRA toolswget "ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/current/sratoolkit.current-centos_linux64.tar.gz"解压tar -xzf sratoolkit.current-centos_linux64.tar.gz添加环境变量export PATH=$PATH:~/downlo
Chris生命科学小站
2023/03/02
7420
转录组——上游分析
FastQC主页:http://www.bioinformatics.babraham.ac.uk/projects/fastqc/
青柠味
2025/06/12
1510
转录组——上游分析
什么配置的电脑可满足基因组索引构建的需求?
经常有朋友问起自己要做什么分析,推荐一个电脑的配置。通常限制程序运行的最主要因素是内存,内存不足程序会直接运行不起来,CPU性能弱顶多是运行的慢,硬盘比较便宜,不需要特别评估。
生信宝典
2022/01/18
7010
什么配置的电脑可满足基因组索引构建的需求?
转录组上游分析流程(四)
环境部署——数据下载——查看数据(非质控)——数据质控——数据过滤(过滤低质量数据)——数据比对及定量
凑齐六个字吧
2024/10/26
2510
转录组上游分析流程(四)
生信技能树-day18 转录组上游分析-比对、定量
今天的是三周合计15天的数据挖掘授课学员一点一滴整理的授课知识点笔记哦,还有互动练习题哈,欢迎大家点击文末的阅读原文去关注我们学员的公众号哦!
生信菜鸟团
2024/06/25
5280
生信技能树-day18 转录组上游分析-比对、定量
转录组测序分析专题——比对/定量
NCBI:https://www.ncbi.nlm.nih.gov/projects/genome/gu ide/human/index.shtml
yurric
2023/10/26
1K0
生信马拉松 Day18 转录组RNA-seq-3
转录组上游的内容终于上完了,今天的内容太抽象了,每一步处理的内容都不是很好理解,现在上完课也还是摸不着头脑,最大的收获似乎是多按tab键?
阿呆的月历
2024/02/29
2810
推荐阅读
相关推荐
转录组分析 | 使用STAR进行比对
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档