<li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>
  • 發布時間:2022-12-19 16:55 原文鏈接: “數據跟著算力跑”到“算力圍著數據轉”的嬗變

    “摩爾定律被打破后,什么將推動超級計算機性能的發展?”

    12月13日,在今年的CCF HPC China 2022上,2021年度圖靈獎獲得者、來自美國田納西大學和橡樹嶺國家實驗室的杰克·唐加拉教授在演講的最后,談及HPC未來發展趨勢,發出這樣的提問。

    一個跨時代的命題

    這個問題的言外之意非常清楚:超算算力的發展以前主要依賴芯片性能提升,但如果芯片性能供不應求,還能依賴什么?

    對這個問題,他也沒有明確的答案。但他提到,HPC硬件廠商開發出先進設備,算法和軟件就要不遺余力地去尋找使用新計算機的方法。

    “向上的空間也很大”,杰克·唐加拉說:“人們可以在硬件的幫助下,通過軟件和算法的改進來探索‘上面的空間’。”

    問題的關鍵是,軟件和算法如何改進,朝著什么方向改進?

    早在2007年,1998年度圖靈獎得主詹姆斯·格雷就在題為《科學方法的革命》的演講中提出,隨著數據的爆炸性增長,科學計算(即“第三范式”)中的數據密集型范式將成為一個獨特的科學研究范式,即第四范式。而超算也將從科學計算工具,向著基于大數據、人工智能的“數據密集型科學”演進。

    有評價稱,詹姆斯·格雷提出的“第四范式”影響了至少一代計算人和科研人,人們開始認真審視海量數據與計算工具間的相互驅動。

    與杰克·唐加拉同天演講的中科院院士、北京航空航天大學教授錢德沛把問題講得更直白:如今的應用“數據規模都很大,在分布式算力中心環境下,數據的放置對于應用的性能和能耗影響都很大”“在計算任務調度和遷移時,要充分考慮數據的傳輸和訪問開銷”。

    超算最本質的是算力,而越來越多應用(如生物信息類)在付諸計算之前,更面臨著數據激增的困擾。如今超算多采用異構架構,以讓各類加速器發揮最大效用;但是異構存在著各類計算單元“各自為戰”的問題……諸多矛盾,如何調和?

    這個問題的一個答案是:面對非結構化的海量數據,多元異構的超算在呼喚“數據融合”。

    一個校級超算的范例

    目前,我國已建成了10個國家級超算中心,20多個人工智能計算中心,許多高校、企業和科研院所也自建了高性能計算系統。然而,有專家注意到,在不少的計算設施中,存儲和網絡這兩大關鍵組件受到的關注度遠遠小于計算組件,以至于計算系統的性能只是“看上去很強”。

    “現有的評價指標過于強調計算這個‘單科成績’,而忽略了系統作為一個整體的表現,從而導致有的地方會設計出一套‘偏科系統’。”上海交通大學網絡信息中心副主任、CCF高專委常務委員林新華在 CCF HPC China2022 上的發布活動中談到,這樣的“偏科系統”往往基準性能測試成績很高,但在實際使用中性能卻不好。

    林新華帶領的上海交通大學高性能計算團隊早早針對這個跨時代的命題作出了有針對性的改變。

    上海交通大學的“交我算”校級計算平臺自2013年開始建設,秉承“普惠、融合”的建設理念,經過多年發展已建設成為國內高校領先的校級計算平臺,具體包括云平臺、人工智能計算平臺、高性能計算平臺等五大計算平臺和科學大數據平臺;并打造聚合門戶,提供統一用戶入口,為師生提供“互聯網”化的計算服務。

    門檻高企的超算應用變成了“互聯網”化的計算服務,林新華介紹說:“原先三個月才能夠完成的計算量,現依靠‘交我算’平臺的超算集群僅需四天。”

    面對紛繁復雜的計算需求,“交我算”是怎么做到如此高效的?

    自2019年起,上海交通大學就與華為存儲展開深度合作,共同打造“交我算”的數據密集型超算平臺。基于華為 OceanStor,“交我算”構建了統一數據基座,將數據融合理念注入高性能計算。

    憑借其長期在超算領域里的技術與應用創新積累,華為存儲將其推出的OceanStor Pacific分布式存儲產品作為“交我算”平臺的存儲池;林新華帶領的交我算團隊則進一步將這一存儲池打造成統一的數據基座,支撐起“交我算”多種異構算力平臺。

    面對數據增長快、計算性能要求高、多元計算集群協調供給、存儲成本高昂等數據困局,華為OceanStor Pacific分布式存儲以出色的全對稱分布式架構、容量與性能的線性增長,提供面向混合負載的高性能,并針對冷、熱、溫數據存放設計智能分級算法,靈活有效地管理數據全生命周期,逐一破解超算應用中對數據存儲的多元訴求。

    數據密集型超算異軍突起

    中科院院士、CCF HPC China2022大會名譽主席陳國良曾對計算應用中的數據量激增有個貼切的比喻。他說,如果說數據是數字世界的新石油,那么“預計到2025年占比將超過80%的非結構化數據”,就是石油中的“頁巖油”。和頁巖油一樣,非結構化數據的“開采”(價值挖掘)難度更大,需要依賴更加專業化的工具。

    陳院士口中的專業化工具,就包括“面向海量數據的高性能數據分析” (High Performance Data Analysis,HPDA)。映射到超算系統,就是數據密集型超算。

    “交我算”即打造了一個典型的數據密集型超算范例。

    “過去,是數據跟著算力跑。”林新華介紹說,為了應對復雜科學和工程問題的快速數值求解,過去半世紀來,業界更多關注的是如何打造最強大的算力,而承載數據的存儲、網絡設備僅作為算力的配套設施來考慮。而今,新興應用的涌現、數據體量的劇增和數據安全問題凸顯,讓數據本身的價值愈發被廣泛認可。

    “融合AI、大數據等技術,以數據為中心,多元算力按需加持,傳統超算已逐步演變成數據密集型超算,多種異構算力緊密圍繞在同一個數據存儲周圍。”林新華說,隨著數據密集型超算的異軍突起,現在形勢發生了反轉:“算力圍著數據轉”。

    “以數據為中心”也就是以價值為中心。“交我算”率先構建起的有統一數據基座的數據密集型超算平臺,完成了對計算服務的提速。如林新華所說,從三個月到四天,計算的提速不僅大幅縮短用戶的論文投稿周期,也大大降低科研人員的試錯成本。

    “重算力、輕存力”現狀待改變

    數據密集型超算,意味著場景應用中的數據分析處理乃至單純的數據存儲是“主角”。然而,從計算機效能視角出發,面對海量數據涌入,超算不能將大量機時浪費在等數據的讀寫上——這就是傳統超算的“存儲墻”難題。

    據統計,我國存力與算力之比約為1:2,對應投資約為1:3;而美國這兩組數據均為1:1。從數據作為新生產資料的角度來看,存力的基礎地位日益彰顯。要改變當前“重算力、輕存力”的現狀,未來我國計算設施還要在存儲基座上下功夫。

    仍以“交我算”為例,“交我算”平臺提供多種異構算力,擁有ARM集群、X86集群以及AI集群等,算力性能水平在全國名列前茅;同時“交我算”同時建有存儲容量高達 35PB 的科學大數據平臺,同樣位居國內高校前列。從局外看,“交我算”的存算比相當可觀。更重要的是,在眾多集群下構建統一數據基座,可顯著促進計算平臺的全數據流動和數據融合,同時能為用戶提供最大便利、釋放算力和數據的最大價值。

    這也更加佐證了,發展數據密集型超算,意味著超算的價值能夠圍繞數據應用的全流程計算去創造。

    相關文章

    數據流通市場的基礎理論與治理方法項目指南

    2024年度國家自然科學基金指南引導類原創探索計劃項目“數據流通市場的基礎理論與治理方法”項目指南以數據要素為核心引擎推動數字經濟深化發展,有利于構建新發展格局、建設現代化經濟體系、構筑國家競爭新優勢......

    國家計量科學數據中心“計量與數字化”學術會議在恩施市順利召開

    10月21日下午和10月22日上午,國家計量科學數據中心在恩施市接續2024年度工作會召開了“計量與數字化”學術會議。本次會議共安排了13場精彩的學術報告,展出了系列學術墻報,并為學術墻報獲獎者頒獎。......

    國家計量科學數據中心2024年度工作會暨“計量與數字化”學術會議恩施州開幕

    金秋十月,丹桂飄香。2024年10月21日,國家計量科學數據中心2024年度工作會暨“計量與數字化”學術會議在湖北省恩施州順利召開。本屆大會由中國計量科學研究院主辦,湖北省計量測試技術研究院和恩施州計......

    中國算力總規模達246EFLOPS位居世界前列

    中新社鄭州9月28日電(記者劉育英)2024中國算力大會28日在鄭州舉行。中國工業和信息化部總工程師趙志國當日在開幕式上介紹,中國在用算力中心機架總規模超過830萬標準機架,算力總規模達246EFLO......

    鄔江興院士:用電力拼算力的范式不可持續

    ·必要多樣性是破解多樣化算力需求下計算系統結構性失配的根本路徑,必要多樣性+超穩定機制才能產生適應不確定性場景的能力。高性能計算被譽為計算機科學工程的皇冠,9月24日,在全國高性能計算學術年會在武漢召......

    主權級大模型創新聯合體入駐“中關村壹號”

    近日,“2024中國算力生態研討會暨中關村壹號——主權級大模型創新聯合體入駐啟動儀式主權級大模型生態1.0發布會”在中關村壹號實驗室召開。會議期間,中國智能計算產業聯盟與中關村壹號實驗室達成戰略合作,......

    持續改善!瑪伐凱泰治療梗阻性肥厚型心肌病迄今最長療效和安全性數據公布

    百時美施貴寶近日公布了MAVA長期擴展研究(MAVA-LTE)中EXPLORER-LTE隊列的最新長期隨訪結果。該研究旨在評估邁凡妥?(瑪伐凱泰膠囊)治療紐約心臟協會(NYHA)心功能分級II-III......

    數據已成為當今企業發展的關鍵要素

    8月28日,2024中國國際大數據產業博覽會在貴陽開幕。會議期間,國家數據局局長劉烈宏主持召開企業家座談會。他表示,企業家提供的情況為分析當前數字領域發展形勢、研究制定政策舉措提供了重要參考。“數據已......

    天平新品專欄|如何應對多通道數據傳輸

    我需要把稱量數據傳到到電腦里做后續的分析;我需要把稱量數據傳輸到我們的LIMS系統里;我需要將稱量數據傳輸到我們的MES系統里;手工記錄麻煩且容易出錯,隨著智能自動化的發展,越來越多的用戶對天平有數據......

    天平新品專欄|如何應對批量樣品稱量數據

    不懼繁瑣,輕松數據管理批量樣品稱量數據如何管理?手工抄錄,費時費力,容易出錯;紙質打印,謄抄錄寫,繁瑣至極;梅特勒托利多新一代高級天平新增稱量結果記事本功能,助您簡化批量稱量工作!稱量結果記事本,針對......

    <li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>
  • 1v3多肉多车高校生活的玩视频