6月末,借助最新大數據技術,繼城市預測、景點預測、高考預測和世界杯預測之后,百度推出疾病預測,將大數據的“觸角”向醫療領域延伸。對此,記者采訪了百度的相關負責人,并獲得百度的獨家回復。
百度預測的新功能“疾病預測”,基于大數據積累和智能分析,能夠為用戶提供流感、肝炎、肺結核和性病這四種傳染病的趨勢預測,幫助用戶提早進行預防。
據了解,中國疾病預防控制中心也為該產品提供了相關疾病監測數據。
此外,百度疾病預測的預測范圍也不僅僅局限于大城市,而是覆蓋到了區縣和商圈。在數據模型方面,其針對每個城市分別建模,擴大數據基礎和精準性來保證預測的準確性。
目前,不少業內人士對這樣的大數據預測疾病心里也沒有底,“我覺得這個可信度大概可以打70分吧”東軟望海科技有限公司總裁焦桐如是對記者說。在他看來,目前大數據監測及分析尚未完全成熟,在分析建模上還有一定的發展空間。但是他也毫不掩飾大數據預測疾病的前景,“這應該是一個必然的趨勢”。
衛生經濟學家陳茁對媒體說,他對大數據預測疾病持樂觀態度,“如果方法得當,大數據對疾病預測依舊有巨大的潛能,還可以在疾病監測防控之外發揮難以比擬的作用。”
而大數據時代下的今天,大數據對疾病監測的準確性到底如何,目前誰也不清楚。還是需要百度“疾病預測”的親身檢驗。
“流行病的發生和傳播有一定的規律性,與氣溫變化、環境指數、人口流動等因素密切相關。每天網民在百度搜索大量流行病相關信息,匯聚起來就有了統計規律,經過一段時間的積累,可以形成一個個預測模型,預測未來疾病的活躍指數。”對于預測原理,百度相關負責人如此闡釋道。
目前,百度疾病預測可提供流感、肝炎、肺結核和性病四種疾病的預測,并可對過去30天及未來七天的疾病變化作出預判。“活躍度”用來反映所選地域該疾病的活躍程度,同時也可通過1~99999的活躍指數反映。用戶可以看到全國或者省某疾病指數排名前十的城市、區縣,以及該疾病相關醫院的搜索排行。
“對于百度疾病預測這樣針對全國范圍的產品來說,可靠性、準確性是我們非常重視的。因此,我們會從統計的角度來驗證數據的正確性,以機器提供的數據為基礎,加入對異常數據的監控和分析,以確保數據的可靠性。”
根據北京大學市場與媒介研究中心發布的2014年4月《搜索市場研究報告》中的數據,百度以市場份額82.7%在桌面端保持強勢領先地位。
因為功能相近,百度疾病預測一經推出,便令人聯想到早在2008年推出的Google流感趨勢預測(GoogleFlu Trends,簡稱“GFT”)。
當年在H1N1爆發幾周前,Google的工程師們在《Nature》上發表論文介紹GFT,并成功預測了H1N1在全美范圍的傳播,令世界為之一振。然而,在此之后,有研究發現,GFT會高估與流感相關的就醫量,在這類數據最有用的流感季節高峰期尤其預測不準確,被《Scientists》雜志認為被大數據浮夸(Big Data Hubris)的算法所誤導。也就是說,Google的流感疾病預測不再那么精準。
相較于GFT,百度疾病預測已經覆蓋提供全國331個地級市,2870個區縣,某些城市甚至已經細化到具體的商圈,“未來甚至可以更加細化到個人粒度”,百度相關負責人表示。此外,GFT目前提供了流感和登革熱的預測,而百度的疾病預測系統涵蓋流感、肝炎、肺結核和性病四種疾病。而據其網站說明,未來還會增加更多的常見傳染病和慢性病。
談及百度疾病預測的產品形態和Google的差異。百度相關負責人補充,Google主要使用query數據,在此基礎上,百度增加了微博、天氣、人群遷徙等數據一并加入預測因素。“此外,Google用的query數據依賴于Google Correlation產品,而百度則是直接從原始日志中進行清洗、消岐、擴展和分析,在數據上做得更細致些,也由此可以提供更加有效的判斷。”
在百度疾病預測的介紹版塊中,特別向中國疾病預防控制中心(以下簡稱CDC)表示了感謝。“在構建流感預測模型的過程中,中國疾病預防控制中心的流感監測結果提供了一定的參考作用。”
實際上,百度疾病預測參考了CDC2006年1月至2014年6月的流感監測周報數據,并且會根據CDC公布的數據定期來更新。
“百度的結果算法在模型搭建上是綜合參考多維度數據結構,其中我們在與CDC數據合作上,不僅是數據互通,同時也會與他們的專家進行產品交流,最終的預測結果主要還是依靠我們所建立的疾病預測模型來完成。”百度相關負責人表示,疾病預測的模型數據搭建于疾病人數自身的統計規律性以及疾病人數與其它相關數據的相關性。
一方面,通過歷史數據挖掘規律來預測未來的趨勢,譬如流感或者手足口等疾病具有季節性周期規律,或者近年來艾滋病整體上具有一個上升趨勢等;另一方面,數據之間存在相關關系,這也會對未來疾病趨勢有所影響。“比如搜‘感冒藥’、‘三九感冒靈’詞的次數與感冒人數之間就具有較強的相關性,在微博上提到手足口病的次數與手足口病蔓延程度有一定的相關性,異常的天氣變化與感冒人數也有一定的相關性等。”百度相關負責人解釋,“我們會通過分析百度的搜索query、微博內容、天氣變化、人群遷徙等數據與疾病人數的相關性,建立機器學習模型,利用這些數據來預測疾病的人數。
事實上,百度的“野心”遠不止簡單的疾病預測,讓“大數據落地”是如今互聯網公司不得不做出的改進,而百度也將在醫療領域深化定制化的健康信息服務。
為了讓疾病預測不只是一堆數據的堆積,而成為“中國人的健康圖譜,老百姓實用的生活助手”,百度正在對此產品進行優化,希望繼續增加病種,以覆蓋常見傳染病和慢性病。
此外,“除了時空數據,我們還會增加天氣、環境污染、用戶屬性數據,希望能夠針對不同用戶,提供個性化的防病、健康信息推送。”百度相關負責人透漏,百度疾病預測還將提供每日疾病指數等細化數據,日后有望增加個人健康顧問、預防治療措施、求醫用藥指導等功能。
10月27日晚間,萊伯泰科披露2023年三季報。2023年前三季度,公司實現營業收入3.00億元,同比增長20.45%;歸母凈利潤0.27億元,同比下降22.77%;扣非后歸母凈利潤0.25億元,同比......
10月24日,知名打假人王海發布視頻稱李佳琦直播間賣和田玉項鏈為假貨。王海出具了國家珠寶玉石質量監督檢驗中心(NGTC)對項鏈的鑒定結果為“碳酸鹽-透閃石質玉項鏈”。王海表示,消費者(向商家)反映后,......
近日,大連醫科大學附屬第二醫院就質譜平臺小分子代謝物檢測服務采購項目公開招標。預算金額1500萬元,詳細信息如下:項目概況大連醫科大學附屬第二醫院質譜平臺小分子代謝物檢測服務采購招標項目的潛在供應商應......
近日,漳州市首個食品安全檢測共享實驗室在吉克檢測技術(福建)有限公司揭牌,實現了食品安全檢測資源的共享,為小微企業解決了檢測難題,推動了食品產業的高質量發展。這個共享實驗室的成立,讓漳州市的食品生產企......
近日,上海市浦東醫院就衛生專用材料-外送特檢公開招標,預算金額350萬元,檢測范圍包括:質譜類、慢病類、腫瘤伴隨診斷及個體化治療、用藥基因、遺傳性腫瘤篩查、遺傳病的診斷、感染精準診斷等。詳細內容如下:......
近日,安徽省政府召開質量強省建設協調推進領導小組會議,聽取安徽省質量強省建設協調推進領導小組增補成員單位和職責調整、今年以來質量強省建設推進情況、省政府對市級政府質量工作專項考核結果、“安徽省質量強縣......
國家安全部官微發文,近年來,全球范圍內網絡失泄密情況日益增多,侵害個人隱私、商業秘密、國家秘密的網絡監聽、攻擊、竊密活動愈演愈烈。一部智能手機、一個應用程序、一個社交媒體賬號,都存在引發失泄密的可能性......
眼下,“元宇宙”成為熱詞,相關企業爭相布局。近日,工業和信息化部等五部門印發《元宇宙產業創新發展三年行動計劃(2023-2025年)》(以下簡稱“《行動計劃》”),提出通過構建先進元宇宙技術和產業體系......
近日,生態環境部辦公廳發布關于公開征求《京津冀及周邊地區、汾渭平原2023-2024年秋冬季大氣污染綜合治理攻堅行動方案(征求意見稿)》意見的通知(以下簡稱:《行動方案》)。《行動方案》指出2023年......
9月14日,王明浩收到了為他的四歲兒子進行天賦基因檢測的報告。這份報告耗資1980元,報告長達14頁,充滿了各種數據和圖表,詳細地描繪了兒子的學習能力、記憶能力、抗壓能力、語言潛能、交際潛能和運動潛能......