5月27日至28日,由中國科學院虛擬經濟與數據科學研究中心主辦(以下簡稱“中心”),上海市數據科學重點實驗室(復旦大學)、悉尼科技大學數量計算與智能系統(UTS: QCIS)以及西安交通大學管理學院聯合協辦的第一屆國際數據科學大會(ICDS2014)在中國科學院大學雁棲湖校區國際會議中心召開。本次會議以“大數據時代背景探索數據科學新領域”為中心議題。來自美國、英國、日本、澳大利亞、香港和中國大陸地區的80余位專家學者就大數據現有的研究水平、大數據帶來的機遇和挑戰、數據科學研究未來的發展方向等熱點問題展開了頗有成效的探討,在諸多數據科學相關問題上達成了一定的共識,取得了十分重要和深刻的成果。
27日上午,中國科學院院士、中國科學院大學副校長吳岳良教授致辭,他代表中國科學院大學對各位海內外專家的到來表示歡迎,并對大數據環境下的科研提出了殷切期望,肯定了中心在數據研究方面的科研工作。隨后,第九屆、第十屆全國人大常委會副委員長、中國科學院虛擬經濟與數據科學研究中心主任成思危先生致辭,并作題為“靜思大數據”的大會報告,他指出目前大數據的研究正處在初步發展階段,數據量的巨大和繁雜使得數據處理十分困難,如何快速準確地從數據中“沙里淘金”成為研究的熱點。成思危進一步指出,對數據的運用已經到了一個前所未有的階段,但數據分析的主要任務仍舊是預測和評價兩種:預測是對未來發展趨勢的估計,能提供各種決策支持;評價是對質量的判定,它建立起一定的標準體系、測度方法、表達方法和綜合評價方法。成思危認為,通過對大數據的分析研究,我們可以判斷事物之間的相關關系,進而找尋它們之間的因果關系。最后,成思危談到了大數據的三個局限性:第一,大數據雖然為定量研究提供了很好的基礎,但對定性分析提出了艱難的挑戰;第二,數據分析的結果只能提供決策支持而不能直接代替決策,這就是所謂的“電腦不能代替人腦”;第三,在大數據時代的背景下,如何更好地保護好人的隱私逐漸成為了熱點問題。
隨后,中國科學院院士、西安交通大學副校長徐宗本教授談到了大數據研究中的幾個關鍵科學問題。他指出,大數據的顯著特點是不能集中存儲,這使得很多常規的數據分析方法不能奏效,另外,雖然大數據的價值密度相對較低,但它的出現對社會科學和管理科學有著重要的意義,即提供了量化分析和評價公共政策的方法。徐宗本指出,研究大數據需要學科交叉,更進一步是數據資源管理與公共政策、大數據信息技術、大數據分析的統計和計算以及大數據工程等多方面問題的疊加,從而最終形成大數據產業。具體地,徐宗本提出了大數據研究中的六大問題:第一,高維問題;第二,抽樣問題;第三,計算復雜性問題;第四,拼接編碼問題;第五,非結構化處理問題;第六,可視化問題。針對這六大問題,他用自己團隊所做的研究實例,深入淺出地闡述了解決這些問題的取得的成果和遇到的問題。
接下來,來自美國伊利諾伊大學芝加哥分校的數據挖掘專家Phillip S. Yu談到了大數據背景下社交網絡分析和信息融合等問題。進一步,Yu教授還介紹了其最近的研究成果,即如何通過將用戶在社交網絡中的活動特征和社會結構特征疊加和綜合到用戶的基本特征中去,挖掘出更為準確和深層的模式,從而在不同的網絡識別相同的用戶。緊接著,來自遼寧工程技術大學的著名學者汪培莊教授做了以因素空間為主題的報告,他介紹了因素空間的基礎理論,并就如何運用因素空間理論對大數據進行結構化處理談了自己的看法和觀點,同時給大家介紹了近期的研究成果,并指出了運用因素空間處理大數據問題的研究核心和發展方向是尋找合適的基向量,這些新穎的觀點引起了與會專家的廣泛關注。同時,中國科學院預測科學研究中心主任、中國科學院大學管理學院院長汪壽陽教授向大家介紹了大數據在經濟預測與分析方面的進展,尤其是預測中心成功運用獨創的TEI@I方法,預測出世界原油和期貨價格的變化趨勢,得到了國內外同行的高度評價。來自中國科學院計算技術研究所的程學旗教授就大數據的復雜性問題介紹了自己的研究工作。他指出,大數據除了可以分析預測經濟走勢,還可以發現大規模中的小細節,他舉了自己為公安部做的追查逃犯的工作,通過逃犯上網記錄,追查其蹤跡,最終將其成功抓獲。程教授指出,這些研究就涉及到如何在網絡大數據環境下尋找罪犯留下的蛛絲馬跡以及社交網絡中的身份識別問題,更進一步的技術是在網絡中對群體的識別和檢測,處理好這些研究中的復雜性問題,能夠為反恐和維護國家安全穩定做出重要貢獻。
27日下午的主題演講環節,來自海內外的專家從管理、理論、技術和應用多個方面,對大數據的研究提出了自己的觀點。在大數據管理方面,中國科學院大學管理學院的呂本富教授提出了大數據分析師的“十條軍規”,這是從管理學角度提出的做數據分析必須遵循的十個重要的規律和規則。同時,他指出大數據帶來管理科學研究范式的轉變,從以前的“大模型、小樣本”發展到現在的“簡模型、大數據”,進一步帶來了管理實踐的轉變,這些賦予數據分析新增的價值。在研究理論方面,來自廣州大學的黃文學教授探討了混合類型數據的測度問題,來自香港理工大學的陳小君教授就如何利用p模規劃探求稀疏解問題展開了深入淺出的討論,來自內布拉斯加大學奧馬哈分校的王震源教授介紹了在模糊數排序和排秩方面的研究成果,來自計算所的何清研究員匯報了獨創的基于超曲面機器學習算法研究工作,來自佐治亞大學統計系的馬平教授從統計角度分析了杠桿算法的理論性質和應用價值。在技術和應用方面,來自新澤西州立大學羅格斯特分校的熊輝教授介紹了運用大數據分析技術對移動設備應用中排名欺詐進行研究,來自加州大學洛杉磯分校的王偉教授介紹了圖聚類的新方法,來自香港中文大學的Jeffrey Xu Yu教授介紹了在大圖像的Random-walk Domination方面的研究成果,來自香港浸會大學的劉際明教授和來自澳大利亞維多利亞大學的張彥春教授分別介紹了自己對健康領域醫學大數據數據分析的研究和建模,取得了卓有成效的結果。另外,來自英國布魯內爾大學的劉小慧教授就智能的數據分析談了自己的看法,他指出對大數據的研究已經從基本的挖掘分析應用上升到科學問題的高度,使得研究者不需要太多專業知識就可以通過分析大數據得到需要的結果,而且這種分析過程必須是可重復的,能夠形成一定的理論方法體系。
28日上午的報告中,來自日本前橋技術研究所的鐘寧教授介紹了腦信息科學的研究成果,對腦大數據的計算和健康分析進行了細致的闡述;來自美國佛羅里達大學的朱興全教授利用哈希方法處理大數據挖掘問題,取得了一定的研究成果。另外,來自德州大學圣安東尼奧分校的孫明和教授介紹了在數據挖掘抽樣技術在商品營銷方面的應用,利用用戶的行為數據,借助張量核函數,構造了支持張量學習機,取得了不錯的預測效果。中國科學院大學計算機與控制學院院長黃慶明教授介紹了利用深度學習和多層學習的方法,對多媒體數據進行知識發現,并通過在線聚類方法來減弱大規模噪聲的影響。中國科學院大學數學科學學院院長郭田德教授介紹了自己與公安部合作開發的新一代指紋身份證系統,解釋了自己在指紋識別問題中采用的新方法和手段,包括基于稀疏表示的指紋圖像壓縮技術,都取得了顯著的成果。
在這些技術層面之外,來自復旦大學的朱揚勇教授就如何訓練數據科學家談了自己的看法,他指出要培養一批真正研究數據本身的科學家,這些科學家是層次性的,掌握從基礎到應用的各種知識的同時,要對數據本身做科學研究,這就需要構建數據科學家團隊。朱揚勇羅列了國內外在培養數據科學家方面已經開展或正在開展的工作,并進一步介紹了自己領導的上海市數據科學重點實驗室的發展情況。西安交通大學管理學院院長黃偉教授做了有關大數據管理研究的報告,他指出,大數據已經發展成一個產業,具有巨大的潛在價值,其技術研究已經取得了很多突破,但與此同時,大數據的隱私保護和管理沒有相應地發展起來,如何正確使用大數據來改變世界成為了目前面臨的重大決策問題。進一步,黃偉提出了大數據產業鏈巨大價值背后所遇到的諸多問題和挑戰,指出培養專門的數據科學人才——首席數據官(CDOs)迫在眉睫。最后,黃偉提出了發展大數據產業的七點建議:第一,在國家層面制定大數據產業發展戰略;第二,制定政策與法規,培養相關人才,引導大數據產業的發展;第三,在全國建立一批研究中心和基地,進行深入的大數據產業研究和發展;第四,建立大數據產業研究中心和基地的示范,供其他省市參考,助其快速發展大數據產業;第五,更改傳統的管理和決策模式(從經驗和直覺驅動,到數據驅動);第六,我國需要迅速開展數據質量領域的相關研究,爭取在國際數據質量研究和標準ISO8000的制定領域占據一席之地,有話語權;第七,可靠而精準的數據質量和穩定而高效的數據傳輸是有效處置公共突發事件的基礎。
中國科學院虛擬經濟與數據科學研究中心常務副主任石勇教授在他的報告中談到了數據科學和大數據的挑戰和發展趨勢,指出大數據的到來將深刻改變人們的生活。他提出了目前大數據研究所面臨的兩個核心問題:第一,研究異構數據(非結構化和半結構化數據)的不同表現形式之間的邏輯關系以尋求基于異構數據的 “多維數據表” 的一般規律;第二,探索大數據復雜性、不確定性特征描述的刻畫方法及大數據的系統建模。進一步,對于數據分析方法的發展,石勇提出大數據方法的核心是數據科學。另外,他還介紹了目前大數據的發展趨勢,包括大數據的國際會議和國際期刊,并指出中國應該早日公開自己掌握的大量數據,以促進大數據研究的發展。最后,石勇還向與會專家學者介紹了中心在大數據挖掘研究方面已經取得的成績和幾個已經結題的重要應用項目。在與企業界的交流過程中,來自新華社的尹小愚處長和秒針系統的馮是聰副總裁分別介紹了新華08項目的發展情況和秒針系統為多家跨國公司所做的數據分析項目,引起了大家的討論。
28日下午是會議的分組討論時間,共有包括數據科學與教育、數據科學和金融應用(新華08)、科學大數據和應用等主題的討論。另外,本次會議共收到11篇科研文章,這些文章的作者也在分組討論中匯報了自己的研究成果。
本次數據科學國際會議聚集了一大批國內外數據科學界頂級的專家學者,它為科學界對大數據研究的新思路提供了交流平臺,同時,一些企業界人士的參加也加強了學界和商界之間的聯系和交流,為促進大數據科研和應用的發展起到了推動作用和有力支持。
據陜西師范大學官網消息,著名分析科學家,陜西師范大學教授、博士生導師、首屆“西部紅燭兩代師表獎”獲得者章竹君先生因病醫治無效,于2023年3月9日20時30分在西安與世長辭,享年86歲。章竹君先生19......
近日,清華大學主導的一項關于北方野火的國際合作研究登上國際科學頂刊Science(《科學》)。研究發現2021年北方森林野火二氧化碳排放創歷史新高,占當年全球野火碳排放的23%。而二十年前這一比例通常......
3月8日,明媚的日光夾雜著海風灑向山東青島國際會展中心,由中國儀器儀表學會分析儀分會、中國儀器儀表行業協會分析儀器分會和北京中儀雄鷹國際會展有限公司共同主辦的“第十五屆中國在線分析儀器應用及發展攻擊論......
3月7日,十四屆全國人大一次會議在北京人民大會堂舉行第二次全體會議,根據國務院關于提請審議國務院機構改革方案的議案,重新組建科學技術部。該議案提到,加強科學技術部推動健全新型舉國體制、優化科技創新全鏈......
日前,寧夏化學分析測試協會批準發布7項團體標準,分別為《枸杞葉及枸杞茶中總黃酮含量的測定》《瓶口分液器評價測試規范》《微量進樣器評價測試規范》《土壤和沉積物吡啶的測定氣相色譜-質譜法》《土壤和沉積物甲......
......
【分析測試百科網訊】上海市分析測試協會舉辦的主題為“聚分析、向未來”的“2022年度上海市分析測試協會科學技術獎學術交流活動”于2023年2月28日在中國科學院上海硅酸鹽研究所所舉行。上海市科委基地處......
2023年3月2日下午,由北京市海淀區教委和中國科學院聲學研究所聯合主辦的首期“海淀區中小學科技教師系列培訓”(以下簡稱“培訓班”)開班儀式在京舉行。習近平總書記在中共中央政治局就加強基礎研究進行第三......
各有關單位:根據《海南省自然科學基金專項和經費管理暫行辦法》(瓊科規〔2021〕12號)和《海南省省級財政科技項目立項評審工作細則》(瓊科規〔2022〕29號)規定,經公開申報、形式審查、專家評審、行......
近日,國際學術期刊《核酸研究》(NucleicAcidsResearch)發表了華中農業大學動物遺傳育種團隊開發的基因組育種大數據計算新工具HIBLUP,中文名為“天權”。相關論文被期刊評為“突破性進......