• <samp id="gwc7m"></samp>
  • <b id="gwc7m"><small id="gwc7m"><dl id="gwc7m"></dl></small></b>

  • <table id="gwc7m"></table>
      1. <b id="gwc7m"></b>
        <var id="gwc7m"></var>
        <wbr id="gwc7m"></wbr>

        Mellanox:當AI “戀上”螞蟻 - 人類需要跳出“計算機”思維定勢

        光纖在線編輯部  2019-09-17 12:12:50  文章來源:本站消息  版權所有,未經許可嚴禁轉載.

        導讀:一只體重只有 1 到 2 毫克的螞蟻,能繞過障礙物,快速有效地找到獵物,這足以讓我們最先進的機器人深感汗顏…… 然而,盡管擁有這些明顯的智慧,那些形單影只的螞蟻也只會漫無目的地四處游蕩,直到數量超過幾十只時才會出現變化;

        9/17/2019, Mellanox公司供稿,作者:Michael Kagan,Mellanox CTO  一只體重只有 1 到 2 毫克的螞蟻,能繞過障礙物,快速有效地找到獵物,這足以讓我們最先進的機器人深感汗顏…… 然而,盡管擁有這些明顯的智慧,那些形單影只的螞蟻也只會漫無目的地四處游蕩,直到數量超過幾十只時才會出現變化;與此同時,更高層次的智能也開始出現。隨著數量的增加,這種轉變更加驚人,數以百萬計的螞蟻可以建造擁有復雜的通風系統、下水道和回收設施的“城市”。螞蟻是除了人類之外唯一具備大規模聯合作業能力的生物,它們種植活的農作物,蓄養和役使蚜蟲及其他昆蟲,“榨取”它們以獲得食物;蟻群會彼此交流、學習、組成團隊并參與戰爭。

        在 2019 年 5 月于巴塞羅那舉行的歐洲IT Spotlight 大會上,我在 NetEvents 的主題演講中,將螞蟻的行為與最先進的數據中心、以及高效數字轉換所需的更高級別智能進行了比較。這種動態反應的智能不應僅存在于 一個CPU、一臺服務器或存儲、或者網絡、或者任何單一的應用程序中,更需要解決的問題是 — 將大量本地數據集在上述所有的設備中進行整體優化,以建立數據中心級計算機。就像蟻群一樣,它們沒有中央控制系統,卻能工作的有條不紊。最新的機器學習模型就像蟻群一樣,也沒有單一的控制程序,在由智能網絡連接、由計算和存儲設備組成的數據中心內,是數據自己在驅動著所有進程。這種“深度學習”也可以與人腦媲美 — 人腦是一個由相對較小的處理元件組成的龐大網絡,這些元件被稱為突觸,它在這個龐大網絡中的移動其實就是在處理數據。

        一個數據爆發的時代
        作為前言,我想舉一個在普通數據采集過程中出現變化的例子。2007 年,諾基亞(一家市值 1,500 億美元的企業)決定投資新興的汽車衛星導航市場,他們收購了 Navitech,一家在歐洲擁有約 500 萬臺交通攝像頭的公司,他們意識到如果導航系統能與實時交通狀況保持同步,將會為其帶來巨大的競爭優勢。同年,一家名為 Waze 的以色列公司成立,該公司的宗旨與 Navitech 相似,只不過 Waze 并非通過安裝數百萬個交通傳感器來收集數據,而是通過每個用戶手機上的應用程序來獲取數據。這使 Waze 可以利用每個智能手機中的 GPS 定位芯片,收集交通流量數據并將其上傳到 Waze的系統,在沒有任何成本的情況下快速部署了數以千萬計的交通傳感器。接下來的情況就眾所周知了:在五、六年的時間里,諾基亞的市值縮水至低于 Navitech 的收購價,而 Waze 則被谷歌收購。

            圖1 帶寬增長與數據處理能力的差距
        這是一個很好的例子,反映了從向外收集數據到讓數據向內涌入的根本性轉變:其中的區別類似于從井中打水和匯集落在地上的雨水。在圖 1 中,我們可以看到這一轉變帶來的一些影響,其中藍色的“數據增長”線在 2007 年之后很快變得更加陡峭,并向上飆升;圖中的直線表示摩爾定律預期的處理能力的線性增長;紅線表示實際 CPU 性能的增長正在放緩,因為我們正在接近芯片的極限。但請注意,表示網絡帶寬的綠線與數據增長的走勢幾乎一致。舊時以 CPU 為核心的思維方式已開始走向沒落,我們需要跳出固有思維模式 — 跳出計算機的思維定勢,以解決當今企業面臨的重大問題。
         
        為了產生有用的業務價值,需要處理大量數據集,然而如今,任何單獨的處理單元都無法做到這點。相反,我們需要的是優化整個棧中的計算、存儲、網絡和應用程序等所有元素,使它們能夠協同工作以建立一個數據中心級的計算機,用整個集群來提供服務。這需要數據為機器編程,而不是由人為機器來編程。正如由數百萬只螞蟻的經驗匯聚而成的大量數據將會激活和產生智能,并能建設性的進行項目開發;機器學習也是從海量物聯網數據中挖掘出其意義和相關性,并創造出新的、高效的應用程序。

        從群體到云
        這是關于云的介紹,云的出現改變了計算的交付形式,云正在將計算從服務器轉向服務。如果你家里有電,這意味著你插上了插座,獲得了電力,就像打開水龍頭接通水管一樣。如果你家里有一臺電腦,傳統意義上這意味著你有一個充滿計算能力的箱子,你要負責讓箱子里的一切都能正常運行。但云計算讓我們更接近于取電的方式,在這種模式下,計算機不再固定于辦公桌上,而更像是一個插座,你可以通過它獲取服務。我們需要跳出計算機的思維定勢,才能理解這種變化的含義。

        如果你對通信的想象僅限于用信鴿來傳遞信息,那么你的創造力可能會局限在一個維度上,尋找飛的更快的信鴿。但如今的視頻會議帶來的不僅僅是快速的溝通,它還可以使在不同位置的人同時看到和聽到,甚至可以實現不同語言之間的機器翻譯。因此,要在性能上實現真正的巨大突破,你需要跳出固有思維。

        我們與 Oracle 合作的關于Oracle集群數據庫系統的改造就是一個不錯的例子。他們最初使用傳統網絡技術,但無論如何優化他們的系統,通信軟件開銷總是瓶頸,性能改進非常有限。然后,在采用了具有 RDMA(遠程直接內存訪問)功能的更加智能的網絡后,他們終于取得了突破。使用這項技術可以消除網絡開銷,并使訪問遠程資源的成本與訪問本地資源的成本相似,Oracle 利用這項技術大大提升了系統資源的效率。經過重新設計的 Oracle 系統,網絡帶寬從 10 Gb/s 提高到 了40 Gb/s,實現了 4 倍的提升;通過采用 RDMA 技術消除了傳統的網絡軟件開銷,他們得到的不僅是這 4 倍的速度提升,而是 50 倍的性能改進。這和更好、更高效的智能網絡是分不開的。

        智能網絡
        智能網絡不僅僅是通過線纜移動數據的速度有多快,而是在網絡的任何地方都變得越來越智能。秘訣就是在數據移動過程中對其進行處理。蟻群中的每只螞蟻都會接收自身感知到的數據,以及通過嗅覺感知到來自其他螞蟻的數據;螞蟻自己會處理這些數據,并通過氣味將自己的信號發送出去,這些信號在網絡中不斷級聯,逐漸在蟻群被賦予了意義和普適性。同樣,在我們最先進的網絡產品中,每個交換機內都有計算單元,因此我們在數據移動過程中進行數據聚合。

        如今,這項技術正在被用于 HPC 和機器學習。當我們對神經網絡模型的多個實例中的數據集進行神經網絡訓練時,在單獨的訓練后,訓練結果需要被整合,這通常需要花費與訓練本身同樣多的時間,分布式執行該過程可將“參數服務器”的處理速度加快 10 倍,從而將訓練的時間從數天縮短到數小時,或從數周縮短到數天。我們稱其為 SHARP — 可擴展分層聚合和歸約協議。其它網絡只會在計算單元之間移動數據,SHARP 卻可以在數據通過網絡時對其進行處理和計算,有效地將網絡本身變成了一個功能強大的協處理器,從而顯著提高應用性能。

        對于存儲網絡,我們提供 SNAP — 基于軟件定義的網絡加速處理。我們的 Bluefield 智能網卡虛擬化技術可以將云中的資源模擬為的本地設備,而不再是需要在主機上更改 API 的網絡設備。SNAP 支持各種基于傳統操作系統的機器,它能夠神奇地將各種東西轉變成本地設備。因此,采用我們的智能網卡,可以調用網絡中的不同機器的資源,將它們作為本地存儲設備來使用,或本機上的本地存儲服務來使用。我們正在與主要云廠商進行試點合作,并計劃在一年后投入生產(見圖 2)。

         圖2 
        再舉一個有效利用資源的例子:網絡功能虛擬化(NFV)是一種強大的技術,可以通過將各種進程整合到裸金屬服務器上以減少到處都是盒子,但這會使負載都集中到服務器,從應用的角度來看,這會降低數據中心的效率,因為它會消耗大量的計算資源。要解決這個問題,你可以將大部分的網絡虛擬化操作卸載到智能網卡上 — SmartNIC。

        這樣安全嗎?
        但這能在不犧牲安全性的前提下實現嗎?傳統的數據中心主要在使用M&M 安全模型,這個模型的特色是外強內弱,主要在數據中心邊緣進行保護。在云應用中,我們允許在運行我們的安全策略的同一臺機器上運行不受我們控制的應用程序。一旦惡意軟件在我們的計算服務器上運行,它可能會接管我們的安全策略,從而接管數據中心。就這樣,整個數據中心被我們許可的在機器上運行的程序接管了。

        為了保護我們的數據中心,我們必須確保攻擊者和受害者不在同一臺計算機上,我們需要改變安全模型,將外強內弱改為外強內也強,數據中心的每臺機器都必須受到保護。

        BlueField的SNAP 技術允許將安全策略運行在BlueField 卡自己的操作系統上,將其應用程序服務器分離出來。借助 BlueField,我們可以將基礎架構計算和應用程序計算分層隔離。此外,我們還可以完全獨立地升級計算服務器和基礎架構服務器 ,互不影響。這樣更安全,也更高效。
        結論

        我們在當下以及未來將面臨的情況是:大量的非結構化數據要求機器學習的能力越老越強,將會產生超出我們想象的新應用程序。估值達 4 萬億美元的盈利商機正等著我們攫取。而跳出計算機的思維定勢將是我們面臨的挑戰。


        關于 Mellanox
        Mellanox公司的英文全稱是Mellanox Technologies(中文名:邁絡思),是一家在全球范圍內為服務器和存儲提供端到端InfiniBand和以太網互連解決方案的領軍企業。Mellanox互連解決方案通過低延遲、高吞吐量的強大性能,可以極大地提升數據中心效率,在應用和系統之間快速地傳遞數據,提升系統可用性。Mellanox為業內提供了加快內部設備互連的技術和產品,包括網卡、交換機、軟件和芯片,這些產品都可以加速應用的執行,并最大化地提升HPC、企業數據中心、Web2.0、云計算、存儲以及金融服務的效率。更多信息請關注:www.mellanox.com。

        注:Mellanox、ConnectX-6、Mellanox Quantum、Mellanox 可擴展分層聚合和歸約協議 (SHARP) 以及 Mellanox 徽標是 Mellanox Technologies, Ltd. 的注冊商標。所有其他商標均為其各自所有者的資產。
        關鍵字: Mellanox AI 人工智能
        光纖在線

        光纖在線公眾號

        更多猛料!歡迎掃描左方二維碼關注光纖在線官方微信
        微信掃描二維碼
        使用“掃一掃”即可將網頁分享至朋友圈。
        真的棋牌