<li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>
  • 發布時間:2020-01-19 15:01 原文鏈接: 李國杰院士:生物醫學大數據時代呼喚計算機結構師

      生物醫學數據已經從PB量級的基因組測序時代進入到多組學融合的EB量級大數據時代。但是,由于生物醫學數據種類繁多、數據分散、內部結構高維復雜,大數據分析比其他領域更困難。目前生物醫學領域雖然數據量增長迅速,但成效并不十分明顯。


    中國工程院院士 李國杰

      大數據與人工智能是一個硬幣的兩面,只有充分發揮機器學習技術的巨大潛力,才能從EB級的數據中獲得有價值的知識。生物醫學領域如果仍停留在采用字符串比對、搜索等傳統的計算機技術,就難以挖掘生物醫學大數據的潛在高價值。但要讓機器學習在生物醫學領域發揮更大的作用,需要在基礎研究方面下更大的功夫。

      為機器學習奠定理論基礎的是圖靈獎得主Valiant,他提出的可能近似正確學習模型(PAC)指出,機器學習只能在一定的誤差范圍內以某種概率保證學習結果正確。因此,不同的領域機器學習的成效取決于該領域對學習誤差和泛化成功率的容忍度。

      眾所周知,醫療領域與人的生命攸關,對醫療判斷失誤的容忍度很低,這就需要更高超的機器學習技術。有人戲謔目前信息領域的形勢是,軟件在吞噬世界,人工智能在吞噬軟件,深度學習在吞噬人工智能,GPU在吞噬深度學習。研究制造更高性能的GPU或類似的硬件加速器似乎成了對付大數據的主要出路。但是如果不清楚該在什么地方加速,只盲目依靠硬件的蠻力是不明智的。

      在30年前上一波人工智能的高潮中,我和華云生教授在一篇綜述文章“A Survey on the Design of Multiprocessing Systems for Artificial Intelligence Applications”中指出:“設計智能系統的關鍵在于對要求解的問題的理解,而不是高效的軟件和硬件。利用基于常識、高層的元知識、更好的知識表示獲得的啟發式信息比改善計算機結構可以獲得更大的性能提高。是否用硬件實現一個給定的算法取決于問題的復雜性和該問題出現的頻率。計算機結構師的角色是選擇好的知識表示、識別開銷密集型任務、學習元知識、確定基本操作,用軟硬件支持這些任務”,這些觀點可能現在還沒有過時。

    <li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>
  • 1v3多肉多车高校生活的玩视频