技術丨思科的 NVMe-oF 的部署錦囊都在這裡了

技術丨思科的 NVMe-oF 的部署錦囊都在這裡了
思科聯天下
今天就來看看如何選擇合適的 NVMe-oF 技術,以及思科的解決方案和不同金融情境下的建議。

對於計劃升級基礎設施以支援 NVMe-oF 的金融業 IT 架構師來說,主要問題是採用何種技術架構。 自然,答案將取決於他們當前基礎設施的內容,以及他們對未來的計劃和預算。

另一個關鍵因素是時機。 NVMe/RoCEv2 目前顯示出潛力,但在準備好可靠地承擔企業級關鍵工作負載之前,它可能還需要幾年的時間來發展。 當技術成熟時,NVMe/TCP 看起來也可能提供出色的性價比,但這同樣需要幾年的時間。

目前,大多數 IT 架構師得出結論,FC 為企業關鍵任務工作負載提供了最成熟的資料傳輸協議,使 NVMe/FC 成為正確的儲存網路架構選項。

複雜的協定棧不是儲存的最佳選擇

NVMe 協定比 SCSI 協定更有效的原因之一是 NVMe 的協定堆疊明顯更簡單。 協定堆疊的簡化性也非常重要,因此我們可以比較不同的 NVMe 結構的協定堆疊。 光纖通道、RoCEv2 和 TCP 的堆疊在下面的儲存 Fabric 協定全棧圖中可以看到差異。

IP/乙太網路相對於光纖通道的複雜性是顯而易見的。 協定中有幾個關鍵問題導致了這種複雜性:乙太網路和 IP(以及 TCP/UDP)在比光纖通道 FC 更獨立的層中實現傳輸管道。 IP 網路的設計初衷是必須支援具有數十億個節點的全球範圍位址分配和路由,需要多個複雜的層面和演算法支援。 光纖通道 FC 是為資料中心規模設計的,有其自身的複雜性,但比 IP 的全球規模要簡單得多。

乙太網路是在網路早期作為一種最佳共享介質開發的。 該協議演變了多種用於避免環路、快速地址學習等的零碎機制。 多年來,流量控制逐漸加強。 相較之下,光纖通道的開發人員能夠從這些早期的經驗教訓中吸取教訓,從而創建一個整體上更一致的協定。

對協定棧的要求。 光纖通道一直專注於高級資料中心用例,因此沒有朝向更大的規模發展。

在這裡承認TCP 和RoCEv2 堆疊的複雜性並不一定會增加微不足道的延遲;許多堆疊複雜性由啟用RDMA 的專用NIC 或TCP offload 在「硬體」 中處理(儘管通常涉及基於ASIC 的處理器核心)引擎 。 但複雜的堆疊在實際部署中會轉化為配置管理、互通性、故障排除與分析等多方面的挑戰。

IP/乙太網路複雜性的遺留問題代表了優質、無損環境中的挑戰:設備的預設行為以及支援人員的經驗和培訓主要面向主流市場。 雖然應該可以利用一些高級操作來配置乙太網路和 IP 設備,但這種操作不是正常的預設設置,通常也不是網路維運中不同角色的能力所及。 相較之下,光纖通道始終被設計為簡單的高可用網絡,這在 NVMe 環境中和幾十年來在 SCSI 環境中一樣都是如此。

新堆疊建立新的安全目標

在光纖通道 SAN 中維護高價值儲存資產的優勢之一是此類結構難以透過 IP 網路存取。 從 IP 協定到穩定的光纖通道協定棧,根本沒有路徑。 攻擊者無法透過 IP 發送光纖通道訊框來探測 SAN。 因此,經常出現的小安全漏洞不會轉換為儲存卷的零日漏洞。 複雜且相對未經驗證的 RoCEv2 和 TCP 堆疊開闢了新的威脅面,這些威脅面相對可透過 IP 訪問,從而增加了整個組織 IP 網路中安全機制管理的複雜性。

企業儲存架構遷移的考慮

NVMe over Fibre Channel 提供光纖通道傳輸的效能和穩健性,以及在同一基礎架構上同時運作 FCP 和 FC‑NVMe 協定的能力。 這種雙協定方法使 IT組織能夠將其儲存磁碟區從 SCSI 順利過渡到 NVMe,有了 NVMe over Fibre Channel,當組織開始採用 NVMe 時,無需推倒和取代 SAN,也無需創建昂貴的新基礎設施。 雙協定 HBA 和驅動程式堆疊意味著每個儲存應用程式都可以根據需要逐步遷移。 SCSI 資產可以逐卷從 SCSI 遷移到 NVMe。 低風險的效能敏感磁碟區可以先遷移,風險敏感的捲可以保留到以後。 此外,可以在頂級企業陣列上建立和維護關鍵資產的主副本,同時可以將營運副本發佈到相同 SAN 中的低成本陣列,以供其他應用程式使用。

金融業應用可以透過多種方式受益於 NVMe 技術。 所以,建議路線圖應該適用於多種 NVMe 解決方案實施。

決定部署哪種類型的NVMe over Fabrics 協定取決於應用,您的資料中心技術設施能力以及這些應用程式對NVMe over RoCE、NVMe over FC 或NVMe over TCP的準備情況,完善的解決方案將支援所有這些協定 ,

思科針對 NVMe-oF 部署的建議

建議NVMe/FC 協定和SCSI/FC 協定使用相同的光纖通道基礎設施,並使用不同的VSAN 來保持NVMe 和SCSI FC 流量之間的分離, NVMe/FC 提供更高的效能和更好的錯誤復原( SLER),目前光纖通道速度為64G,128G 標準正在研究中。

整體的方案示意如下:

Cisco MDS 提供豐富的基於ASIC 的NVMe/FC 分析功能,以及用於進一步分析NVMe 幀的專用附加NPU,目前基於以太網技術的NVMe over ROCEv2 和NVMe over TCP 還沒有基於晶片級別的可以分析NVMe 幀的 能力。

思科的 MDS SAN 解決方案能提供對 NVMe/FC 完整的支援

這是客戶在涉及 SAN 的對話中最常見且最關心的問題。 Cisco MDS SAN 完全支援 NVMe。

•透明支援 —— 無需額外的硬體/指令
•可與任何目前使用 Cisco NX-OS 8.x 版本的 16G/32G 交換矩陣交換器或目前 Cisco MDS 9700 16G/32G 模組搭配使用
•無需額外許可證
•無需額外功能即可識別 NVMe 指令

針對 NVMe 的整體部署方案,思科提出了 NVMe-Anywhere 整體解決方案

此方案建議通常 NVMe/RoCEv2 使用無損乙太網路部署在機架內, 流量工程透過 DSCP、PFC、ECN、DCQCN、IB/CNP 功能進行管理,以發揮 NVMe/RoCEv2 的最佳效能。 對 NVMe/RoCEv2 進行故障排除需要了解 Infiniband TH 協定。 NVMe/RoCEv2 不能用於長距離(NVMe/TCP 是更好的選擇),因此在一部分場合可以部署 NVMe/TCP 解決方案。 採用思科的N9K 解決方案實現NVMe/RoCEv2和NVMe/TCP的同時,N9K支援FC/FCoE 的特性,配合思科MDS 交換器可以實現全端全連通的NVMe over Fabric 資料中心解決方案,實現真正的NVMe-Anywhere 才是客戶現實環境的最佳選擇,同時相容於現有SAN 環境,實現無縫遷移,多層存儲,新舊設備共存,充分體現投資保護。

在思科 NVMe-Anywhere 整體解決方案下,思科提出針對 NVME-oF 的選擇建議:

•將企業級關鍵任務應用程式部署在 NVMe/FC 光纖通道環境中;
• 關鍵業務的儲存遷移可以在統一的 FC 結構上直接進行,從 SCSI 遷移到 NVMe/FC;
• 對於某些考慮較低成本或較長距離需求的 NVMe 儲存資料流量,可以使用 NVMe/TCP ;
• 針對 cloud native 相容的部分應用場景,可以考慮採用 NVMe/RoCEv2 作為 DAS 替代,目前狀態下流量應盡可能限制在機架層級(低於 TOR 交換器);
• 儲存網路要具備 NVMe 流量的可視分析能力;
• 透過統一的融合管理平台管理混合結構 (Ethernet/FC) 。

綜上,在目前的階段下,針對金融業的應用特點,大部分使用情境以確保關鍵業務的可靠性和安全性為首要目標。 因此,選擇成熟、穩定、安全的 NVMe/FC 技術作為關鍵業務場景的首選,對於非關鍵業務場景可以考慮其他類型的 NVMe-oF 技術。 思科公司憑藉完備的產品線和經驗豐富的技術支援能力,可以幫助金融業客戶採用 NVMe 技術支援各種類型的應用,實現 NVMe-Anywhere。

技術|向全棧可觀察性演進

作者:Aditya Mohta

Leader, Solution Marketing, Full-stack observability, Cisco

對所有企業而言,應用就是自己的門面,目前企業面臨著該如何盡快獲得數字化轉型項目成功的巨大壓力。提供無可挑剔的應用體驗是當務之急,有 84% 的企業表示相較以往,能夠讓業務應用不斷保持極佳性能顯得更為重要。

現代應用非常複雜

應用體驗比以往任何時候都更加複雜。現代應用是由運營在雲原生和混合雲架構上的微服務構成,而這些架構又基於極度分散的服務,從而最終導致環境複雜紛繁、快速多變。一項服務中出現的一個小問題可能會對整體體驗產生累積影響

在此類複雜環境中進行操作時,我們所需的信息和經驗在不同的工具和團隊之間被分散和割裂。這會降低企業識別問題、確定優先級以及有效解決問題的能力,而這會對用戶體驗產生直接影響,甚至可能殃及整個企業及其品牌和聲譽。

從監控到可視性再到全棧可觀察性的質變

隨著應用日趨複雜,我們對於應用的監控和觀察方式也應隨之改變。

我們在早期採用監控方式,當時每個團隊都擁有各自的看板,這些看板是基於被動獲取的信息構建的,通常是內置在看板中基於抽樣方式構建的警告和事件。當時,企業最關注的 KPI 在於可用性。

隨後,整個行業發展到了可視性階段,更主動地去獲取遙測數據。特別是有指標、事件和日誌以及根因分析的加持。然而,每個團隊或領域依然各自為陣,使用獨立的工具。當時衡量可視性的首要 KPI 在於性能方面。

如今,基於前期監控和可視性發展成果,整個行業邁入了全棧可觀察性階段。業務上下文被加入到了業務會話內。除了指標、事件和日誌功能之外,還新增了用於測量雲原生應用端到端體驗的跟踪功能。隨著全棧可觀察性 (FSO) 的興起,安全性也變得越來越重要。但在當今市場,我們所目睹的最大轉變是能夠在多個領域和多個團隊之間實現全棧可觀察性,因為在由混合型部署或云原生部署驅動發展的世界中,傳統式監控和/或孤島可視性所能提供的功能已屬杯水車薪。全棧可觀察性可提供高業務環境可用性和性能,以便您能有效監控應用體驗。

新聞丨思科推出全棧可觀察平台

思科聯天下
新聞摘要:
• 思科新的全棧可觀察平台(FSO Platform)支持多廠商,聚合來自多域、可擴展的數據。
• 包括 CloudFabrix、Evolutio 和 Kanari 在內的合作夥伴生態系統賦能重要的使用場景,通過可觀察的遙測快速交付客戶。
• 新平台的強大功能提供無與倫比的洞察力,優化客戶體驗並最大限度地降低客戶的業務風險。

近日,在美國拉斯維加斯舉辦的 Cisco Live 2023 大會上,思科宣布推出全新的全棧可觀察平台,這是一個支持多廠商的解決方案,匯聚企業整個產品組合的能力,它提供符合情境的、有相關性的,和預測性的洞察,使客戶能夠更快地解決問題並優化體驗,同時最大限度地降低業務風險。

這一行業領先的產品支持新的可觀察生態系統,聚合來自多域的數據,包括應用程序、網絡、基礎架構、安全、雲、可持續發展和企業資源。

思科全球執行副總裁、首席戰略官兼應用事業部總經理 Liz Centoni 表示:

“ 數字優先的業務環境中,全棧可觀察至關重要。思科全棧可觀察將多雲環境和全棧中的網絡智能、安全洞察和應用可觀察結合在一起,為企業在深入業務場景時提供卓越的數字體驗。”

思科的 FSO 平台專注於開放遙測,並以指標、事件、日誌和追踪 (MELT) 為基礎,使企業能夠無縫收集和分析任何來源生成的 MELT 數據。思科 FSO 平台還設計為一個具備一致性的可擴展平台,允許開發人員構建自己的可觀察解決方案,賦能客戶和合作夥伴生態系統。

思科 FSO 平台應用:雲原生應用可觀察

雲原生應用可觀察是在思科 FSO 平台上提供的首要解決方案。它可以幫助客戶實現業務成果,做出正確的與數字體驗相關的決策,確保性能與最終用戶期望保持一致,確定優先級並降低風險,同時保護工作負載。

除了雲原生應用可觀察之外,思科 FSO 平台上的第一組模塊還包括:

• 成本洞察:提供應用層面的成本及性能指標可見性和洞察,幫助企業了解其云應用的財務支出,同時支持可持續發展。

• 應用資源優化:提供對 Kubernetes 工作負載資源利用率的可見性,企業可以最大限度地提高資源利用率並減少過多的雲支出,幫助他們實現財務目標和可持續發展目標。

• 安全洞察:生成基於應用的業務風險評分,以幫助 DevOps 和 SecOps 團隊確定優先級並消除雲原生應用或服務上極有可能被利用的漏洞。

• 思科智能運維管理平台:在一個位置可見性與基礎設施、網絡、事件和業務應用性能相關的情境化數據。簡化和優化 IT 的運營需求。

思科已經與包括 CloudFabrix、Evolutio 和 Kanari 在內的合作夥伴合作,為思科 FSO 平台開發多樣化的解決方案,思科同樣受益於此。這些解決方案支持極具價值的用戶案例,並通過可觀察的遙測快速交付客戶。

思科 FSO 平台宣布合作夥伴正在構建新的解決方案,並將平台的應用範圍擴展到新客戶和業務場景:

• 來自 CloudFabrix 的 vSphere 可觀察性和數據現代化:該解決方案通過思科 FSO 平台觀察 vSphere 數據,並將其與 Kubernetes 和基礎架構數據相關聯,以跨基礎架構和容器化應用棧生成見解和建議操作。

• Evolutio Fintech:該金融科技可觀察解決方案旨在通過基於提取的數據(如付款和信用卡授權)管理 KPI 來幫助客戶獲得業務洞察。

• Kanari 容量規劃和預測器:它提供了與容量規劃和預測事件相關的時間序列數據的可見性,這些事件具有通過預測 ML 算法(ARIMA,SARIMA,LSTM)確定的風險因素。容量規劃和預測器還允許企業採取可持續、有彈性的方法來規劃和追踪資源。

思科 FSO 平台標誌著思科加速 FSO 戰略的關鍵進展。合作夥伴可以通過可擴展性為自身和客戶交付更多價值。 AI 驅動的根本原因分析、體驗優化和事件管理與業務場景相關聯,因此團隊可以在事件影響最終用戶及其業務之前識別、確定優先級、預測並解決問題。