一.科學性
1.研究意義
信息科技經過 60 余年的發展,已經普及到社會生活的每一個角落。隨著信息技術在國家治理、經濟運行的方方面面的應用,大量的數據隨之產生。而互聯網技術的爆發式發展使得近年來產生的數據總量超過了人類以往產生的歷史數據的總和,醫療行業的數據增長幅度尤為突出。
醫療大數據具有巨大的價值,尤其是在臨床輔助診療和健康管理方面。醫療大數據已經上升到國家戰略,同時也是全球學術界與產業界競爭的研究熱點。如何利用這些醫療數據,挖掘數據的深層價值,是未來信息科技發展的趨勢,也是醫療大數據技術產生的背景。
本項目利用知識圖譜將各種瑣碎、零散的醫療信息知識相互連接,以支持綜合型知識檢索問答、輔助決策和智能醫療診斷。精準醫學知識與大數據相結合,能夠利用龐大的全人類對疾病的理解和醫生的經驗形成知識庫,讓醫生能夠通過大數據的信息系統直接根據病人的個體實際情況來對他們進行針對性的診斷和治療,輔助醫生的診療過程,使得普通醫生也能夠像最好的資深醫生一樣為病人提供高質量的診療服務。
本項目結合知識圖譜和醫療大數據技術,可以幫助患者自我評估病情,幫助醫生找到最佳治療方案,提高醫生工作效率和診療質量,為慢病患者提供遠程指導和干預。
2.醫療大數據的爬取與存儲
(1) 利用互聯網搜尋可靠、權威的醫療數據來源,按照疾病所屬科室利用多線程技術分段爬取全部數據,保證涵蓋全部疾病內容,并在數據爬取過程中,分析數據結構,包括科室、癥狀、病因、并發癥、治療、預防等。
(2) 針對爬取的數據進行分詞,用于后續算法設計,最后將全部數據結構化存儲至本地 MySQL 數據庫。
(3) 利用 Elastic Search 數據庫快速地儲存、搜索和分析海量數據。將MySQL 中存儲的數據抽取部分部分存入到 Elastic Search 數據庫,然后開發相應接口,返回JSON 格式的數據。ES 數據庫的主要功能:一是用戶在輸入框輸入癥狀詞時提供實時搜索結果;二是點擊部位時搜索到全部相關癥狀。
(4) 使用 Neo4j 圖形數據庫存儲一部分結構化的數據,便于進行算法設計,搭配分詞、檢索、排除、統計等算法提升診斷正確率。
|
|