<li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>
  • 發布時間:2014-12-15 13:00 原文鏈接: 劉成林:做計算機的“導師”

      

    劉成林

      “科研院所應該集中力量從事前瞻性的基礎研究和應用基礎研究,與公司的技術研發形成差異性互補。”劉成林并不介意與公司分享自己的科研成果,他深知,如果自己的研究企業也能做,那么科研就喪失了意義。

      一段字跡潦草的手寫文檔,通過文檔脫機識別指令,轉瞬間就變為字跡工整的印刷體文檔。

      在中國科學院自動化研究所研究員劉成林的辦公室里,《中國科學報》記者有幸目睹了脫機手寫文檔識別的演示,從文本行的分割,到文本的轉換,看似簡單的兩個指令,卻凝聚著劉成林二十多年來的辛勤付出,他像一位導師教計算機識別文檔。

      專攻文檔分析

      智能手機的手寫輸入就是一類簡單的文字識別,應用模式基本上是單字識別。劉成林告訴記者:“單個字符的識別技術目前已經相對成熟,因此我專注的研究領域是整個文檔的識別,學術上稱其為文檔分析。”

      據劉成林介紹,文檔分析可以分為聯機和脫機兩類。聯機文檔分析顧名思義就是通過實時采集書寫的軌跡,并進行識別生成電子文檔,前面提到的智能手機的手寫輸入法就是聯機文檔分析的簡單應用。

      在聯機手寫文檔分析領域,劉成林曾提出一種筆畫分類方法和一種充分利用時域和空間域信息的文本行分割方法,從而實現了正確分割任意方向的文本行。他還指出,該領域當前的主要研究集中在整行文字的切分與識別。

      在脫機手寫文檔分析領域,還存在著一些亟須解決的技術難題。比如,對過去書籍和文獻(統稱為歷史文檔)的分析。“歷史文檔主要以紙張的形式,數量巨大,閱讀和檢索相對困難,卻有著大量的應用需求。”劉成林說,“相比聯機文檔分析,脫機文檔分析技術難點之一是文字的切分,因為識別對象是一段或一行文字,不是單個存在的。”

      通過這些年的攻關,劉成林課題組在無約束中文手寫文檔圖像上取得了90%以上的文字切分和識別正確率。而在6年前,這類文檔識別的字符正確率不到50%。當然,要實現手寫文檔識別技術的大規模應用,還需要進一步提高識別性能。

      11月25日,自動化所收到美國電子電氣工程師學會(IEEE)通知,經過嚴格評審,劉成林因在手寫文檔分析領域的杰出成就而當選會士(IEEE Fellow)。IEEE Fellow是該組織授予其會員的最高榮譽,每年當選人數不超過IEEE會員總人數的0.1%。

      一顆堅持的心

      從1992年來到自動化所攻讀博士學位到如今,劉成林已是自動化所模式識別國家重點實驗室的主任。“雖然這些年有過彷徨,但我的研究領域始終沒有改變。”

      早在上世紀90年代,國內就出現了多個從事文字識別和文檔分析的科研單位和企業,并且一些科研成果和產品還頗受好評。劉成林很慶幸自己在那個時候有機會出國,“如果留下,也許我也會放棄文檔分析的研究。”當年從事文檔分析的科研人員有一些后來退出了這個領域,劉成林給出了自己的分析:“可能一些企業認為那時的文字識別技術和產品已經相對成熟,沒有進一步研發的必要。這種誤解導致文字識別研究的前景不被看好,也難以申請到科研經費。但對一個科學技術問題來說,真正解決問題需要至少幾十年的時間。”

      1996年到1999年,劉成林先后在韓國和日本從事博士后工作,并于1999年加入日立中央研究所(東京),成為文檔分析領域的一名研究員。“在日立,我把自己的背景和公司的技術需求、積累與資源充分結合起來,在幾年時間研制了很多種有效的算法。”

      劉成林向記者舉了一個例子,他將自己研制的文字識別算法,應用到日本的郵政分揀機,讓機器通過對郵政地址的識別去分揀郵件,這樣在很大程度上減少了人工,也讓劉成林進一步認識到文檔分析的應用價值。

      雖然在國外的幾年,劉成林學產生了很多文檔分析的算法和應用成果,但2005年重新回到自動化所后,他卻對自己即將開展的國內科研工作產生了困惑。

      “研究所和企業從事研究的性質和目的不一樣,而我之前在日本的研究主要為企業服務。回國后開始幾年,我對文檔分析研究的學術和應用前景還是沒有十足的信心。”經過很長時間的考慮,劉成林還是想清楚了,文檔分析技術有巨大的應用前景,目前應用不多是因為很多技術問題沒有解決。因此,他把文檔分析技術和模式識別基礎理論研究結合起來,堅定了長期研究的決心和信心。

      做前瞻性研究

      在日本、韓國、美國等國家,公司的研發力量往往強于大學。劉成林告訴記者,日本并不鼓勵大學教授開公司,一方面因為大學的研究偏向基礎性,不適用于公司,另一方面擔心產業技術研發會影響基礎研究的深入。

      “科研院所應該集中力量從事前瞻性的基礎研究和應用基礎研究,與公司的技術研發形成差異性互補。”劉成林并不介意與公司分享自己的科研成果,他深知,如果自己的研究企業也能做,那么科研就喪失了意義。“一項技術一旦到了應用階段,自己與公司相比就沒有了優勢,但自己研制的算法被公司轉化為產品是很有價值的。”

      為此,劉成林明確了自己的研究重心,即在聯機和脫機自由書寫文字與文檔識別及檢索、場景圖像和視頻中的文本定位與識別、基于圖的機器學習、基于判別學習的分類器設計與自適應等方面開展基本方法和關鍵技術研究,推進文檔分析技術的發展和產業化應用。

      通過率領科研人員和研究生刻苦攻關,目前劉成林團隊研發的技術已在移動設備文字輸入、金融票據處理、網絡圖片文字識別、視頻文字識別等領域獲得了成功應用。

      提到現在主要從事的脫機文檔分析和場景圖像文檔識別,劉成林表示,這些研究至少還需要5年的時間才能得到廣泛應用。“我們研究不僅要面向學科前沿,還要面向國家重大需求。”

    相關文章

    章新政等團隊揭示甲病毒的新型受體識別機制

    中國科學院生物物理研究所章新政課題組與清華大學醫學院向燁課題組合作,通過揭示新型受體在不同甲病毒中不同的受體識別模式,共同幫助理解了甲病毒在多個物種中廣泛入侵的傳播機制。相關論文近期發表于《自然-通訊......

    音樂識別力似不隨年齡增長而下降

    有些阿爾茨海默病重度患者不會說話,認不出人,但仍能唱出童年的歌謠或彈奏鋼琴。英國林肯大學一項最新研究給這些現象提供了科學證據。研究顯示,與許多其他形式的記憶不同,識別和記憶音樂的能力似乎不受年齡影響,......

    中國科協發布十大前沿科學問題,新污染物問題再度入選

    7月2日,在第二十六屆中國科協年會主論壇上,中國科協發布2024重大科學問題、工程技術難題和產業技術問題。其中,由中國環境科學學會推薦的“對多介質環境中新污染物進行識別、溯源和健康風險管控”問題入選為......

    腦電信號識別研究中取得進展

    腦機接口是大腦與外界交互的新方式。腦機接口繞開外周神經,通過在大腦與外部設備之間建立直接連接以進行信息交換,在神經康復、認知計算等領域頗有應用前景。然而,如何實時地、有效地將大腦意圖轉換為控制外部設備......

    腦電信號識別研究中取得進展

    腦機接口是大腦與外界交互的新方式。腦機接口繞開外周神經,通過在大腦與外部設備之間建立直接連接以進行信息交換,在神經康復、認知計算等領域頗有應用前景。然而,如何實時地、有效地將大腦意圖轉換為控制外部設備......

    高通量測序基因分型系統規范即將實施!

    國家標準《信息技術生物特征識別高通量測序基因分型系統規范》將于2023年12月1日正式實施。該標準由TC28(全國信息技術標準化技術委員會)歸口,TC28SC37(全國信息技術標準化技術委員會生物特征......

    機器人廚師能看視頻學烹飪

    據英國《新科學家》網站5日報道,英國劍橋大學科學家為其機器人廚師編寫了一本由8種簡單沙拉菜肴組成的菜譜,在觀看了一段人類演示如何制作其中一種菜肴的視頻后,機器人也做出了這道菜。這有望使應用機器人廚師變......

    新型有機薄膜傳感器以全新方式識別光

    德國科學家研制出一種新型有機薄膜傳感器,它能以全新的方式識別光的波長,分辨率低于1納米。研究人員稱,作為一款集成組件,這種新型薄膜傳感器未來可替代外部光譜儀,用于表征光源。這一技術已經申請ZL,相關論......

    倒立時為何識別能力下降?空地兩項實驗共同作答

    我們人類和小雞一樣,都對正立的生物運動更敏感,說明這種敏感性可能是長期進化的產物。這種現象的進化意義在于,它能幫助我們選擇性地對符合地球重力作用的運動模式反應,從而更有效地探測環境中生命體的存在。——......

    新“人造鼻”用呼吸識別“你是誰”

    指紋、虹膜掃描這樣的生物認證過去常會出現在間諜片中,但這項技術的使用范圍早已擴大,指紋驗證和面部識別已在人們手機上司空見慣。現在,生物識別安全工具包又增添了新選項:呼吸。據《化學通訊》雜志22日發表的......

    <li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>
  • 1v3多肉多车高校生活的玩视频