李國杰
“當前,大數據已成為社會熱潮。這股熱潮的主要驅動力來自網絡服務公司,各地政府投資大數據的主要目的則是增加GDP,但其實發展大數據的意義不僅僅體現在經濟上。”日前,在清華大學舉行的大數據時代高端論壇上,中國工程院院士李國杰表示,發展大數據技術的另一個重要意義是促進社會公平正義,促進國家治理的現代化。“大數據的挖掘分析還能促進科學研究,尤其是基礎科學研究的發展。面對大數據浪潮,我們的科學研究也需要作出一定的調整。”
“大數據就如同蜜蜂,其主要價值是傳播花粉,自己生產的蜂蜜價值并不大。”李國杰介紹說,2013年世界范圍內狹義的大數據產業產值只有186億美元,但廣義的大數據應用幾乎覆蓋所有產業。據麥肯錫公司預測,開放數據僅在教育、保健等7個行業便可釋放3.2萬億~5.4萬億美元的經濟價值。
然而,在李國杰看來,大數據對社會的貢獻并不僅限于經濟領域。“大數據分析是認識客觀世界的新工具,將開拓計算機科學的新領域——數據科學,同時基于大數據分析的科學研究第四范式必將給全球科技發展帶來深刻影響。”
當前,大數據的發展已給傳統計算機科學帶來挑戰。李國杰坦言,計算機科學是關于算法的科學,傳統的圖靈計算把“輸出值”當成“輸入值”的函數,假定輸入的數據是隨意的,并不關心輸入數據之間的相互關系。然而,現在的研究發現,其實輸入數據本身也是值得研究的對象。“這就是數據科學要研究的內容。”
“在某些情況下,小數據條件下好的算法在大數據條件下可能不再適用。反過來,也有一些問題,數據多了反而更容易解決。大數據的興起導致計算機科學的重點從算法研究向數據科學轉移。”李國杰說,目前的大數據技術大多是針對專門應用開發的,其實應研發更加通用的大數據分析和管理技術,發展像關系數據庫這樣的理論指導海量非結構化Web數據的處理。
與此同時,越來越多的研究人員開始在數據不斷涌現的科學領域摸索,數據驅動型發現也將成為科研的主要形式,熟練應付大數據將很快成為必備技能。對此,李國杰表示,伴隨著所有科學都迅速變成“數據科學”,需要在各領域培養既有專業知識又熟悉數據分析的人才,使之擁有分屬于不同領域的“雙腿”支撐前進。
此外,李國杰強調,為順應大數據時代潮流,我們需要重新構建一張以大數據為基礎的“門捷列夫周期表”。
“‘門捷列夫周期表’的發現,為化學成為一門獨立科學奠定了重要基礎。而在很多學科中,我們也需要對某些基本元素進行系統分析。”李國杰表示,目前生物領域有基因組學,生理學、病理學、制藥、干細胞等領域都在研究“基因組”,也有人在討論人類語言的“基因組”,這些基因組其實都是構成學科整體的基本元素。而發現這些“基因組”需要通過計算機對海量數據進行分析,這導致各學科領域紛紛出現“某某信息學”的分支學科,凸顯了大數據在許多學科中的基礎性作用。
“從上世紀70年代開始,圍繞計算復雜性,已形成了以算法研究為中心的計算機科學。但隨著計算機科學與其他科學的交叉融合,其研究重點將逐步轉移到以研究各種基因組學為重點的數據科學。從這個角度來說,現在已經到了發現一張新的‘門捷列夫周期表’的時候了。”李國杰說。
2024年11月9日至11日,首屆分析科學與儀器大會“8分會-質譜科學與儀器”在成都天府國際會議中心成功舉辦。本分會由中國分析測試協會主辦、中國科學院大連化學物理研究所張玉奎院士、國家自然科學基金委員......
睡眠對心血管健康至關重要,但連接心血管病理和睡眠的回路尚不清楚。10月30日,一項發表于《自然》的新研究發現,心臟病發作后,免疫細胞會迅速涌向大腦并促進深度睡眠,這種深度睡眠通過緩解心臟炎癥促進康復。......
中國科學技術館發布《鋪設通往科學之路——面向變革時代的科技館》出版采購項目評審結果公告公告原文:各有關單位:按照《中國科協采購管理辦法》有關規定,本項目分別于2024年9月18日和10月8日發布了申報......
國家藥典委員會發布關于征集藥用輔料標準研究用樣品的通知(2024年第三批)。原通知如下:各相關單位:2024年我委將繼續組織開展《中國藥典》藥用輔料標準研究。為增強藥用輔料標準研究用樣品的代表性,確保......
23日,2024年世界科技與發展論壇主題會議在中國科技會堂舉行。在開放科學基礎設施相關主題會議上,開放科學基礎設施共享協作倡議正式發布。該倡議提出四方面行動:共建全球網絡,增加開放科學基礎設施的數量并......
10月21日下午和10月22日上午,國家計量科學數據中心在恩施市接續2024年度工作會召開了“計量與數字化”學術會議。本次會議共安排了13場精彩的學術報告,展出了系列學術墻報,并為學術墻報獲獎者頒獎。......
記者從中國科協10日召開的新聞發布會上獲悉,為讓更多剛剛踏上科研道路,處于人才梯隊“塔基”、職業生涯“破繭期”的青年人才受益,中國科協近日啟動實施青年人才托舉工程博士生專項計劃,面向高年級在讀博士研究......
關于征集“集成芯片前沿技術科學基礎”重大研究計劃2025年度項目指南建議的通告國家自然科學基金重大研究計劃“集成芯片前沿技術科學基礎”2025年度項目指南建議征集已通過科學基金網絡信息系統(https......
2023年,全國研究與試驗發展(R&D)經費投入保持穩定增長,投入強度持續提升,基礎研究投入取得新進展,國家財政科技支出穩步增加。一、研究與試驗發展(R&D)經費情況2023年,全國共......
文|卜金婷2021年的一整年,劉俁都在經歷失敗。這是劉俁在美國國家標準技術研究所(NIST)做博士后的第一年,他轉換了研究方向。彼時,憑借“初生牛犢不怕虎”的干勁,劉俁一入門就接手了一個大難題:利用分......