前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇醫療大數據范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。

當前云計算、物聯網、移動互聯網等技術飛速發展,數據的種類和規模以前所未有的速度增長,如何管理和利用大數據成為當前研究的熱點。云計算和大數據技術對數據處理及服務方式產生巨大影響。文章闡述了云計算和大數據的內涵特征基礎,結合醫療領域,論述了大數據的研究意義及云計算下大數據處理方式。闡述了云計算下大數據技術不僅改變了傳統的數據管理模式,必將帶來極大的經濟與社會價值。
【關鍵字】
云計算;大數據;醫療行業數據;應用研究
一、前言
隨著社會的發展,人們日常生活與工作產生的數據量越來越大,人類已經步入了大數據時代。數據變化具有以下趨勢:第一是海量數據的需求。數據基本是以每年成倍的速度進行增長,數據量的需求分析也更細,對它的門檻要求也更低,傳統的數據庫無法滿足這種需求。第二是快的需求。數據得到的同時,希望有智能的產生,希望能夠直接產生效果。第三現在的開發者,需求是多樣化的,很多時候關系型數據庫并不是最優的解決方案。數據的不斷增長,給數據存儲、數據管理和分析利用帶來了機遇;在這些包括個人信息、消費記錄等的海量數據之中,蘊含著許多有價值的信息,能夠為企業經營及管理提供參考。云計算作為這個大數據時代的主流技術,對于大數據的應用管理又有著重要影響。云計算是大數據的IT基礎,而大數據是云計算的一個重要應用。
二、大數據的概念與意義
1、大數據的概念
大數據,即巨大數據量,不能夠通過主流的軟件工具,在適當的時間內收集管理處理及組織起來,使之作為企業決策的有用信息。大數據,需要特別的技術,由大規模并行處理(MPP)數據庫、數據挖掘網格、分布式文件系統、分布式數據庫、云計算平臺、互聯網和可擴展的存儲系統組成。“大數據”,需要更多的決策權及洞察發現力及過程地大規模優化能力,應對新模式高增長率及信息資產多樣化。大數據技術的戰略意義并不是一個巨大的數據信息的掌握,而是因為這些包含了專門的數據進行處理。大數據的特點可以概括為4個“V”(大量Volume,多樣Va-riety,價值Value,高速Velocity)。首先,龐大的數據量。大數據的初始測量單元至少為P(1000個T),E(100萬個T)或Z(10億個T);二、數據類型豐富。例如,網絡日志,視頻,圖片,位置信息等。第三,低密度,高商業價值。第四、快速處理速度。這最后一點是傳統的數據挖掘技術本質上是不同的。大數據技術,是一種先進的數據分析技術,能夠從各類數據快速獲取有價值地信息,它需要新地加工方式,實現更大決策力地海量高增長率及多樣化的信息。
2、大數據的意義
面對大數據直接從所有的數據分析,挖掘所需信息。分析數據挖掘是混合的有不同來源數據結構,要求其對樣品的精度高并且關注數據相關性地研究。大數據為云計算及計算能力提供了解決空間,對于大數據存儲挖掘及云計算業務,大數據需要高效節能的海量云服務器,并從海量數據提取有價值地信息,能夠對政府金融零售娛樂及媒體領域帶來革命性的變化。云計算是基礎信息存儲,為數據共享和挖掘方法提供有用的工具,通過數據的分析和預測使決策更加準確。中國擁有龐大地高度復雜性充滿變化的用戶群體,將成為世界數據量最大的國家。探索基于大數據的解決方案能夠解決海量數據帶來的問題,并使國內產業升級和提高效率。
三、云計算技術與大數據結合應用
1、云計算技術
云計算,是互聯網基礎設施底層的抽象,是互聯網相關服務的使用和交付模式,并提供一個具有擴展性和虛擬性地動態資源。云計算,將加工程序自動分割成許多較小子程序,通過互聯網使一個或多個服務器搜索大量系統的計算和分析的巨大處理能力。最后將計算處理結果反饋給用戶。云計算,強調動態計算能力,大數據,是靜態計算的對象。
2、云計算與大數據關系
云計算和大數據是相輔相成的關系。云計算提供了大數據存儲和操作地一個計算平臺,大數據則利用分布式處理方法來應用此平臺,云計算與大數據,前者強調計算能力,需要處理大量復雜數據:包括數據獲取、整理、轉換、統計。云計算,要用大量數據作為運算地基礎,兩者是必然趨勢結合。在具體實際應用中,云計算促進了大數據的實際應用,這種應用出現在公共問題領域等。借助云計算、云存儲、數據丟失、病毒入侵等問題的優勢,保障數據安全和爆炸性增長的數據為企業帶來了新的機遇和挑戰。
四、大數據在醫療行業應用
1、醫療行業數據分析
隨著醫院信息化的快速發展,醫療行業產生大量的醫療數據,如何使這些數據提供幫助,即節約醫療成本,提高醫療質量,目前,醫療數據的應用,還有一些問題,一是醫療數據分散在各個醫療機構,二是數據利用率很低,醫院信息系統積累了大量的數據,但在大多數情況下僅限于管理層面,很少涉及臨床專業水平。在面對大量的醫療數據積累的情況下,如果可以進行有效的數據分析和數據挖掘,可以獲得大量的有價值的信息,可以幫助醫療和醫院決策者,從而推動到醫院提供更好的醫療服務,提高治療質量。大數據技術將在醫療領域的公共基礎服務領域應用,將能夠幫助醫院推動醫療行業的進步。
2、大數據的應用
由于區域醫療信息化及醫療物聯網地應用,能夠產生大量地數據:如測試結果、成本數據、傳感器數據、基因數據和圖像數據等,并且還包括大量的在線實時數據分析和處理的需求數據,它們滿足大數據4V特征,屬于大數據類別。為了創造經濟和社會價值,如何有效地管理利用這些海量地醫療數據是醫療行業面臨的挑戰。在醫學領域中大數據技術的應用前景廣泛。主要包括以下幾個方面:
(1)臨床決策支持系統
將大數據技術應用于臨床決策支持系統,能使系統更加智能化。由于大數據分析技術的非結構化數據的強大的分析能力。例如:在醫學文獻數據庫通過數據挖掘,為醫師提出更合理的診斷及治療意見,提醒醫生對于預防潛在的錯誤,例如由于藥品不良反應等,通過采用圖像分析與識別技術,對醫學圖像數據進行識別并提高診斷和治療的質量。
(2)個性化地醫療系統
通過對患者進行如基因組數據分析的個性化醫療大型數據。綜合分析患者的特點及療效數據及對患者進行基因測序的調查,對某一疾病患者的藥物特殊性和敏感性的反應關系,及在治療過程中的特殊性進行靶向治療。
(3)監測與預報流行病
在中國疾病預防控制中心,建設突發公共衛生事件和國家傳染病網絡報告系統已投入運行,每年存儲的病例報告和信息有600多萬左右,覆蓋了全國所有縣疾病控制機構信息的年度報告。通過大數據技術報告海量數據可以進行綜合性地分析及檢測,對于通過綜合疾病監測及反應程序,準確預測傳播時間和路徑,方便采取有效措施,減少傳染病的患病率。流感的準確預測是利用大數據技術成功案例。谷歌公司對流感準確預測的成功案例是大數據技術的應用。谷歌公司把美國最常使用的搜索條目。與流感疫情在美國疾病預防控制中心的數據相比,確診了是否感染流感。人們通過使用特定的如“咳嗽和發熱藥”搜索詞,便獲得流感治療的互聯網信息,建立了特定的搜索條件和時間空間與流感之間聯系。比美國疾病控制和預防中心的數據提前一周。檢測流感傳播路徑,他們的判斷很及時。近年來,醫療行業面臨著海量數據和非結構化數據的挑戰,許多國家都在積極推動醫療信息化的發展。因此,大數據技術在醫學領域的應用前景十分廣闊。
五、結束語
大數據技術在醫療領域的大規模應用尚不完全成熟,但隨著高速網絡、云計算中心等基礎設施建設日趨完善和大數據技術的發展,醫學領域發展的趨勢,將是推動大數據技術的個性化、創新化,便利化醫療。云計算、移動互聯網和物聯網技術的快速發展,全球范圍內數據增長規模越來越大,大數據將被應用到各行各業,不僅改變了傳統的數據管理模式,帶來了新的思維、業務轉型和管理創新,提高企業和公共部門的生產力和競爭力,也會帶來巨大的經濟和社會價值。大數據已成為新發明和新服務的來源,是社會新的財富。
作者:郭群 單位:遼寧對外經貿學院信息管理系
參考文獻:
[1]張德豐.大數據走向云計算[M].北京:人民郵電出版社.2014.4.1.
關鍵詞:大數據;醫療;大數據挖掘
引言
隨著信息時代的不斷發展,海量的數據被產生出來。在人們的日常生活中,方方面面都可能產生數據。這些數據反應了社會規律和自然規律,被認為是一筆重要的戰略資源,與自然資源等可以相提并論。有統計顯示,一般的醫療機構每年會產生1TB到20TB的數據,一些大醫院甚至可以產生300TB到1PB的數據。隨著技術的不斷進步,人們處理數據的能力和技術也不斷增強。從前,人們只能看著這些寶貴的數據白白丟失;現在,這些數據有望被運用到智慧醫療方面,即讓患者就醫更方便、疾病診斷更加高效,以及醫療信息更加準確。
一、大數據概述
(一)大數據的定義
隨著智能手機、平板電腦、移動互聯網、物聯網等各式各樣傳感器的涌現,數據源呈現指數級增長,信息數量迅速擴大。從這些海量數據中提取有用信息并加以利用,已經成為戰略性發展和要求。大數據可以通過在海量數據中提取的有用信息,挖掘新的認知,創造新的價值,從而改變市場關系和組織機構。
關于大數據的定義,目前學術界仍然沒有獲得統一共識。一般認為,大數據指的是巨量數據結合,是指無法在一定時間范圍內用常規軟件工具和軟件進行捕捉、管理和處理的數據集合,是需要更強的決策力、洞察發現能力才能加以挖掘和應用的數據。大數據不是單純的海量數據,而是大量種類繁多、價值密度低、處理速度要求快和實效性要求高的數據的集合。目前,大數據在互聯網、金融、農業等領域都有廣泛的應用。
(二)大數據的特征
通常,用4個V(即Volume, Variety, Value, Velocity)來概括。
一是體積巨大。截止到目前,人類生產的所有印刷材料的數據量是300PB,大企業一年生產出的數據量大多處于TB量級。
二是數據種類繁多。對此,人們把這些數據分為結構化稻鶯頭墻峁夠數據。結構化數據多以文本為主,非結構化數據則包括音頻、視頻、地理位置信息等。這些數據為數據的挖掘處理能力提出了更高要求。
三是價值密度低。在大量不斷生產的數據流中,只有極少數的數據是有價值的,如何在海量數據中挖掘真正有用的數據,進行數據“提純”成為大數據工作者研究的重點。
四是處理速度快。據統計,預計到2020年,全球數據使用量將達到35.2ZB。在如此海量的數據面前,各國政府及企業能否加快處理數據的效率,將成為成敗的關鍵。
(三)大數據的意義
大數據最重要的意義是預測。比如,商業公司對消費者日常的購買行為和使用商品習慣進行匯總和分析,了解到消費者的需求,從而改進已有商品并適時推出新的、消費者很可能會滿意的商品。知名互聯網公司谷歌對其用戶每天頻繁搜索的詞匯進行數據挖掘,從而進行相關的廣告推廣和商業研究。
由于大數據的處理迫在眉睫,近年來各國政府和全球學術界都掀起了一場大數據技術的革命,都在積極研究大數據的挖掘技術和分析手段。很多國家都把大數據技術研究上升到了國家戰略高度,提出了一系列的大數據技術研發計劃,從而推動政府機構、學術界、相關行業和各類企業對大數據技術進行探索和研究。
可以說大數據是一種寶貴的戰略資源,其潛在價值和增長速度正在改變著人類的工作、生活和思維方式。可以想見,在未來,各行各業都會積極擁抱大數據,積極探索數據挖掘和分析的新技術、新方法,從而更好地利用大數據。當然,大數據并不能主宰一切。大數據雖然能夠發現“是什么”,卻不能說明“為什么”;大數據提供的是一些描述性的信息,而創新還是要人類自己來實現。
二、大數據對醫學研究的影響
(一)大數據改變醫學診斷手段
大數據分析為許多醫學難題的解決提供了新途徑,改變了一些疾病診斷方式。大數據可以挖掘出大量以往的相似疾病案例,通過分析這些診斷數據,對疑難雜癥進行快速判別。如,在心臟病的診斷過程中,首先采集心臟數據并轉化為心臟圖譜,然后根據圖譜進行建模,模型中的變量包括壓力、張力、僵硬度等,最后根據這個模型分析心臟疾病病情,并作出相應的診療方案。此外,還可以利用圖像處理技術,將心臟數據建模成為一個虛擬實體,通過設置不同的參數,模擬觀察各類手術或者藥物對心臟機能造成的影響,從而在診療之前就對診療后心臟疾病可能的走勢做出預測,為獲取疾病診治方法提供了手段。
(二)大數據可預測病情的擴散趨勢
當流行病發生時,可以對疾病已有的擴散趨勢和感染人數進行建模,對每一個時間節點的數據進行分析處理,從而對流行病進行統計研究,預測病情的擴散趨勢,為疾病防治提供參考。同時,當下一次疫情發生時,可以調出往年數據進行分析,了解規律,從而有望抑制病情的進一步擴張。
(三)大數據有望決定現代醫藥學研究成敗的關鍵
當前在我國,優質醫療資源有限,患者往往需要爭搶醫療資源,才能獲得一個寶貴的治療機會。然而,患者個體差異巨大,疾病種類繁多,且仍然有很多現代醫療技術無法解釋和治療的疑難雜癥,使得診斷很難標準化和自動化。同時,醫生在治療時,治療手段和方法、治療進度等并不公開透明,缺少病人的主動參與。此外,醫生工作強度大,醫療資源不足,誤診漏診現象時有發生,使得醫患矛盾不斷加劇,醫患關系已經在近年來成為了一個社會問題。大數據醫療則可以使患者主動參與到醫療過程中。醫生可以在海量數據中找到病人的既往病史、體質特征、健康數據等資料作為輔助,從而更好更快地為病人做出準確的判斷。
此外,以往醫院的醫療數據都是獨立的,病人若首次在某家醫院就診,醫生還需要花費時間和精力了解病人的既往病史,既降低了診治效率,也增加了病人就醫的時間成本。大數據使得醫院之間互通數據成為了可能,可避免患者在多個不同的醫院之間進行重復診治而付出高昂的醫療費用。大數據醫療有望構建一個以患者為中心的個性化平臺,為患者提供疾病治療、疾病管理、掛號預約、健康數據查詢等多方面的服務,充分尊重患者的價值觀和需求,協調不同專業的醫療服務。可以說,大數據有望帶來醫學研究、臨床決策、疾病管理、醫療衛生決策等方面的改變甚至革新,從而帶來整個醫療模式的轉變。
三、大數據在醫療行業的應用
(一)疾病預防
大數據可以幫助研究者比之前任何時候都更了解健康影響因素。有統計顯示,大約只有10%到15%的健康影響因素已經被現代醫學確定,而剩下的85%到90%的影響因素,包括基因、健康行為、自然和社會環境均未被確定。利用大數據,研究者可以將患者的家族病史、醫療記錄等與平日的生活習慣、飲食習慣、收入、教育等方面聯系起來,通過對海量的數據進行分析比對,研究這些健康影響因素相互之間的關聯。通過對不同區域、不同年齡的人群進行評選,篩選健康相關危險因素,并制作健康監測評估圖譜數據庫和知識庫,提出有針對性的疾病預防計劃,以促進居民健康水平的提高,降低患病風險。這樣一來,大數據可以顯著提高醫療和健康服務,且對不同的人群提供不同的干預措施和針對性的解決方案。
大數據還可以整合和分析公共衛生數據,提高疾病預報能力,加強對疾病的監測。例如,Asthmapolis公司為哮喘患者研發了一種追蹤器,記錄患者吸入器的使用,并⑹據傳輸到中央數據庫進行分析,用來了解個人患者的疾病進程和使用習慣。將這些數據與疾病預防中心的哮喘危險因素數據結合,能夠有助于醫生為患者制定更加個性化的預防、治療計劃。
(二)臨床應用
在醫學臨床方面,大數據有著廣泛的應用天地,包括相對療效研究、醫療資料的透明化、病人病歷的進階分析、藥物副作用分析和遠距離監測病患。
1.相對療效研究
信息時代使得電子病歷的普及成為可能。目前,電子病歷結構化數據已逐漸成熟,通過大數據分析海量的醫療數據,比較分析不同的干預措施的有效性。這為臨床治療決策提供了非常有用的參考信息。在醫療護理系統中利用大數據實現相對療效研究,將大大提高疾病診療的效率,減少過度治療以及治療不足。
2.醫療資料的透明化
大數據分析可以對不同醫院的治療費用、治療質量與績效進行評估和比對,并快速呈現出來,讓患者一目了然。此外,大數據有望精簡業務流程,從而降低成本,提高醫療護理質量并給患者帶來更好的就診體驗。
3.患者病歷的進階分析
目前,電子病歷系統包括三部分數據,即電子病例數據、醫學檢驗數據和醫學影像數據。電子病歷是病人自述病癥、醫生記錄產生的以文字標書為主體的數據,是一種非結構化的數據。醫學檢驗數據來自于醫學檢驗設備,主要包括各種數據,具有標準性和規范性的特點,是一種結構化數據。醫學影像數據則包括X光片、B超影像等來自醫學影像設備的數據,由于這些數據以圖像為主,因此是一種非結構化數據。構建電子病歷系統,可以全面掌握患者的病情演進情況。大數據可以對海量的患者病歷和檔案進行進階分析,確定哪些人是某類疾病的高危感染人群,并按照不同患者的既往病史為其提供不同的治療模式和不同的預防性保健方案,才能達到最佳治療效果。
4.藥物副作用分析
在臨床用藥的過程中,藥物使用可能會引起患者的不良反應。這種不良反應會導致藥物不能發揮原本的作用,治療效果減弱,嚴重時甚至導致患者死亡,同時不合理的用藥也可能大大集中患者的經濟負擔。來自美國的統計顯示,每年美國有70度萬人因為藥物副作用受到傷害或者死亡。通過對產生藥物副作用的患者病情進行分析,挖掘出不同藥物的副作用可能產生的情況,從而提高患者疾病的治療質量,指導臨床用藥,減少藥物副作用或不當用藥對患者的傷害,并指導新藥研發。
5.遠距離監測病患
隨著傳感器的進步和物聯網的發展,大量可穿戴設備、各類App等出現,能夠實時獲取病人的健康信息。許多高血壓、心臟病、糖尿病患者在家中測量的血壓、心率、體重、血氧、吐氣流量等健康指標和數據都可以傳回醫院或健康管理中心,給醫療人員提供診斷參考,便于給患者提供飲食和生活建議。
(三)互聯網醫療
互聯網的發展與大數據技術的進步使得在線醫療成為了可能。在互聯網醫療網站上,患者提供病癥相關數據,醫生根據這些病癥數據,對患者的病癥情況進行初步判斷。該方法能夠在一定程度上環節醫療資源不足和分布不均的情況,但是無法從根本上解決這一難題。由于常常有非專業人員給出診斷答案以及缺乏詳盡的病理數據,通過互聯網醫療網站很難得到準確的醫療治療。此外,網絡藥房也在近年來逐漸興起。通過網絡藥房,患者可以購買非處方藥,或是提供醫生的處方購買處方藥,等待藥品送貨上門的。這種方式減少了患者去藥房或者醫院的時間成本,有一定的發展空間。
四、大數據在醫療領域應用的幾個關鍵問題
將大數據全面應用于醫療領域中,構建醫療大數據系統,除了國家政府從政策層面鼓勵支持和加強引導之外,各級政府及醫院等相關機構也需要行動起來,積極迎接大數據。
(一)推廣電子病歷,實現數據標準化采集
各級政府應鼓勵醫院使用電子病歷。在使用電子病歷的醫院中對醫生作出一些規范性的要求,使電子病歷記錄規范。此外,醫學檢驗數據和影像檢驗數據的采集和存儲也需要規范,同事要建立統一的數據庫存儲系統來分門別類的存儲這些信息。在推廣電子病歷和構建醫療大數據系統中,數據標準化十分重要,是技術實現的關鍵問題。
(二)確保數據庫的安全性
病歷是患者的個人隱私。將這些隱私信息被轉移到線上時,應該注意數據庫的安全性,保障患者的個人隱私。技術部門要持續更新病毒庫,定時對數據庫系統進行查漏補缺,同時不斷攻克技術難關,加強數據庫的安全性,確保患者隱私信息得到保障。
(三)大數據挖掘分析方法
要想真正將大數據為己所用,適當的大數據挖掘分析方法必不可少。大數據挖掘的核心內容是數據的特征與屬性提取,并依據特征和屬性進行分類。在此基礎上,對不同屬性的數據類型進行關聯分析,從而獲得有價值的信息。目前,大數據挖掘分析方法包括分類、估計、預測、聚變等。大數據相關從業人員有必要不斷學習理論知識,同時在實踐中積累大數據挖掘分析經驗,從而提高大數據分析能力。
五、結語
大數據分析是當前計算機科學與技術領域的熱點。各個領域都認識到了大數據可能帶來的好處,獲得大數據并挖掘其中有價值的信息對于領域發展十分重要,也是未來科學發展的必然方向。在醫療領域,大數據有著廣泛的應用空間,可以用在包括疾病預防、臨床應用、互聯網醫療等方面。可以說,醫療大數據是未來醫療領域的發展趨勢。目前,在醫療行業應用大數據方面,我國還處于初級階段,政府、醫院及數據挖掘技術人員需要共同努力,才能讓大數據在醫療領域發揮作用。
參考文獻:
[1]鄒北驥.大數據分析及其在醫療領域中的應用[J].計算機教育.2014(7):25-27
[2]周光華,辛英,張雅潔,胡婷,李岳峰.醫療衛生領域大數據應用探討[J].中國衛生信息管理雜志.2013(4):74-76
巧合的是,當天有媒體報道了我國30省份至少有275位艾滋病感染者個人信息遭泄露的事件。犯罪分子在詐騙電話中能準確地描述出病患的個人信息,包括真實姓名、身份證號、聯系方式、戶籍信息、確診時間、隨訪的醫院或區縣疾控等等,并謊稱能為病患辦理補助而需要收取不菲的手續費。中國疾病預防控制中心相關負責人于7月17日表示,國家艾滋病感染者相關信息系統被列為國家網絡信息重點安全保護對象,目前已經報案,將積極配合公安部門盡快破案。此事還引起了世界衛生組織駐華代表處和聯合國艾滋病聯合規劃署駐華代表處的關注。7月18日,兩家代表處聯合發表聲明,強調“加強現有系統以杜絕類似信息入侵事件再次發生,至關重要”。
國家對于健康醫療大數據的安全十分重視,據統計,《意見》中,“安全”這個詞出現了33次。而此次疑似真實發生的醫療數據安全事件,成為“安全是核心基礎”的最佳注腳。
他山之石,可以攻玉
――英國健康醫療數據安全的審查和建議
不止我們,許多其他國家也發生了一系列事件,向全世界宣告了他們對健康醫療數據安全的關切。在英國,國家醫療服務體系(National Health Service, NHS)于2016年7月6日做出停止care.data健康醫療大數據平臺的決定中,“安全”即是重要原因之一。
在很大程度上,NHS決定關閉care.data,是基于7月6日的兩份評估報告。第一份報告《安全的數據,安全的醫療》(“Safe Data, Safe Care”)由英國醫療質量委員會(Care Quality Commission,CQC)。醫療質量委員會是英格蘭健康和社會醫療的獨立監管機構,其職責是監控、檢查和評價醫療服務,促進醫療服務符合標準規范以保證其質量和安全。作為獨立第三方,CQC經常地區、國家級的健康和社會醫療質量報告。2015年9月,受英國衛生大臣委托,CQC對NHS處理病人敏感數據過程的安全現狀進行審查,并提出改進數據安全的建議。
第二份報告《對數據安全、同意和選擇退出的審查》(“Review of Data Security, Consent and Opt-Outs”)是由英國“國家健康和醫療數據守護者”(National Data Guardian for Health and Care, NDG)。2015年9月,英國衛生大臣也委托其與CQC緊密合作,共同提出新的數據安全標準、測評數據安全合規的新方法,以及獲取同意共享數據的新模式。在英國,NDG由衛生大臣任命,其主要職責是確保公眾能夠信任醫療健康系統將保護個人信息,以及個人信息將被用于提高健康醫療水平。
CQC和NDG在對533起數據安全事故調查后發現,大多數事故與紙質的醫療記錄相關,且80%到90%的數據安全事故是因為工作人員的習慣無意之中引起的,比如點擊了不安全的鏈接、丟失了存儲數據的介質等。但是隨著醫療信息系統的普及、數據的逐步集中化及對公眾開放訪問入口,如果不提升安全防護水平,更嚴重、更大規模數據泄露的風險將會增加。綜合CQC和NDG的報告,英國NHS數據安全工作中存在以下問題:
首先,雖然很多機構都建立了數據安全方面的策略與規程,但并沒有在日常工作中得到有效實施,很多機構只依賴策略和規程,而不是通過檢測驗證系統是否足夠安全,也未要求其供應商也遵循同樣的管理措施。
其次,NHS的絕大部分工作人員認可數據安全的重要性,但是培訓質量參差不齊,有些機構培訓覆蓋面不夠,未涉及合同商、數據共享方、臨時員工等,有些機構未將安全事故經驗作為培訓內容的重要參考。
再次,機構往往不清楚如何從目前存在的大量安全標準中選取合適的參考,許多機構很少去學習其他機構保護數據安全的做法,也很少請外部第三方機構做專業的安全測評。
針對上述問題,CQC和NDG提出的建議簡要概括如下:第一,每個機構的領導應該明確數據安全的責任人和其職責,類似于組織醫療事務和財務的管理和問責制度,包括建立有效的內審機制,必要時進行外審以驗證安全措施有效性,對惡意類數據安全事件進行嚴厲處罰等;第二,所有的工作人員應該獲得足夠的資源,包括正確的信息、工具、培訓等,以便于他們履行數據安全處理和共享的職責;第三,IT系統和所有的安全協議都應該按照實際的病人治療過程和一線工作人員的需求進行設計;第四,應該按照新的數據標準要求設計自評估系統,并選取優秀的案例供其他機構進行同步學習;第五,NHS應該修改通用財務合同模板,確保各機構能夠落實數據安全標準,地方機構和供應商簽署的合同也應有相應的條款,當供應商無法滿足安全要求時不應與其續簽合同。
雖然NHS以及care.data計劃在數據安全管理方面受到詬病,但從以上審查結果中不難看出,英國作為健康和醫療大數據集中應用的先行者,已經在數據安全方面做了很多有價值的工作,比如配套的法律法規、標準規范,任命了專門的數據保護官員,建立了獨立的監管和審計機構,建立了數據安全風險管理的信息系統等。
但是,由于健康和醫療數據的高度敏感性,對其進行集中存儲和管理后,一方面會引起惡意人員的高度關注,另一方面一旦發生數據泄露其影響面非常廣,對于每個病人來說其后果很難挽回;因此,健康醫療數據的安全工作可謂難上加難,即便英國具備一定的基礎,其數據安全治理也未在一開始取得理想的效果,但從近期頻繁的安全審查中可以看出,英國政府建立的數據安全監督機構、數據保護官等正在發揮積極作用,正視已出現的問題并提出注重實效的解決方案,以重新贏回公眾的信任。
善治病者,必醫其受病之處
――我國健康醫療數據安全形勢嚴峻
早在2013年底,國家衛生和計劃生育委員會就了《關于加快推進人口健康信息化建設的指導意見》,提出在“十三五”期間將大力推動全國人口健康信息大平臺的建設。從安全需求上來說,這個信息平臺一是將承載全國13億公民的人口、健康、醫療等隱私信息,數據保密性要求高;二是將提供公民個人醫療保障、診療等信息化服務不能中斷,業務連續性要求高;三是將為國家衛生計生行業未來發展提供決策依據,信息容錯率要求高。然而目前,我國在健康醫療數據安全保障方面情況堪憂,行業整體安全態勢趨于嚴峻。主要問題包括:
首先,行業合并導致底數不清。衛生、計生行業合并時間并不算太長,業務層面的整合已初步實現,但數據層面的整合尚屬起步階段,在實際執行過程中易滋生死角盲區。從網上已公開的醫療行業信息安全事件中不難發現,絕大多數安全事件的第一步突破點來自于安全管控體系的“法外之地”。
其次,行業信息安全人才與經費保障缺口較大。據不完全統計,醫療行業2015年整體信息化建設資金超過300億,但信息安全投入不足6億,占比不足2%,而對于有較高安全保障要求的行業,安全占比普遍超過10%;在人才隊伍方面,專業信息安全從業人員嚴重缺失,許多機構甚至出現“身著白大褂的大夫在看病之余兼職管安全”的狀況。
再次,缺乏具備行業特色的信息安全指導框架。健康醫療行業特殊性較高,目前行業雖然已推行國家信息安全等級保護要求,但尚未建設具備行業業務特點的信息安全保障體系,也沒有專門的行業信息安全技術標準,不利于有針對性地開展安全防護工作。
第四,行業網絡涉及面廣,不易管控。我國醫療衛生機構總數已超百萬,以藥品方面為例,我國有6000多家化學制藥企業,藥品經營流通企業17000多家,而作為世界制藥大國的美國,才分別為200多家和50多家。超大規模、超復雜接入對構建安全的衛生計生網絡來說,難度巨大。
另外,不易樹立行業信息安全標桿。全國醫療信息化及軟件生產供應商達數百家。以行業龍頭東軟集團為例,其擁有的市場份額不足5%,離散化的分布導致安全的最佳實踐無法快速復制推廣,在現有保障能力下也很難做到“避輕就重”“抓大放小”。
【關鍵詞】遺傳算法 數據挖掘技術 醫療大數據 應用
醫療行業具有其本身的特殊性和復雜性,醫療大數據所包含數據信息更加駁雜,借助醫療大數據能夠有效的轉變傳統的決策依據。同時,借助醫療大數據的數據挖掘技術,可以完成對患者的相關病情研究,并合理對患者進行用藥。數據挖掘技術在醫療大數據中的應用價值十分明顯。基于此,本文分析基于遺傳算法的數據挖掘技術在醫療大數據中的應用,分別對基于遺傳算法的數據挖掘技術和具體在醫療大數據中的應用進行闡述,具體內容如下。
1 遺傳算法的數據挖掘技術分析
1.1 數據挖掘
醫院對日常患者信息收集、藥物信息錄入和相關管理信息充斥著醫院的數據庫,導致數據數量日漸增加。而這些龐大的數據信息中,涵蓋了作用明顯的數據信息和作用不顯著的數據信息。而為了從這些駁雜的醫療信息中,獲取有效的病例信息、藥物信息,需要選擇有效技術類型。數據挖掘技術則是一種從海量數據、存在噪聲和模糊的數據中進行目標信息的提取,并對相近的數據信息進行提取。借助數據挖掘可以為醫院完成治療預測和降低醫療成本、明確各類藥物的基本情況,實現對藥物副作用的發現、輔助公共衛生檢測,積極推動醫院醫療服務水平和服務質量的提升。
在實際的醫療大數據挖掘中,可以對分類算法、聚類算法、實踐序列和的關聯規則和回歸預測等方法進行應用,從而完成對醫療大數據的有效挖掘,進而獲取準確的數據信息,保障醫院醫療服務的質量和相關決策的效率。
1.2 遺傳算法
遺傳算法是建立在的“自然選擇”和“適者生存”的基礎上,結合具體的適應度值情況,先在某一特定種群中選取一定數值的染色體,并通過對種群進行迭代,從而獲得滿足終止條件的最優解。遺傳算法在迭代過程中,主要是通過選擇、交叉和變異等操作方式,促使種群完成自然選擇。且遺傳算法的關鍵內容主要以染色體編碼、種群初始化和適應度函數等。常見的遺傳算法實例有人工魚群算法、蟻群算法等。
借助遺傳算法的數據挖掘技術能夠有效完成對醫療大數據中的數據信息的攫取,并獲得有效醫療數據信息為醫療服務奠定基礎。
2 遺傳算法的數據挖掘技術在醫療大數據中的應用
2.1 數據挖掘對象
從數據挖掘技術的基本能力上看,數據挖掘技術,可以完成對任意類型的數據信息存儲的數據信息挖掘。根據醫療大數據的基本情況,基于遺傳算法的數據挖掘對象是互聯網的相關醫療數據信息和醫院內部的患者病例、藥物信息、費用信息和管理信息等內容。其具體的數據挖掘目標是根據使用者的基本需求,完成對目標信息的獲取。
2.2 基于遺傳算法的k-means算法改進
基于遺傳算法的k-means算法改進有效的將遺傳算法和k-means算法相結合,在具體的醫療大數據挖掘中的應用,具體的算法設計如下:
(1)編碼方案和種群初始化;設聚類中心的坐標為d維,k個簇的每個染色體長度為k×d,染色體為{P1,P2,P3……Pk},其中Pi={Pj1,Pj2,Pj3……Pjd}。對于對應的每條染色體,隨機從n個對象中的k個為的初始聚類中心坐標。
(2)適應度函數的選取,為了保障醫療大數據的數據挖掘技術的有效性,必須要對適應度函數進行合理選擇,具體的適應度函數如下公式(1)所示:
(3)操作選擇。為了完成對遺傳算法的更好操作,需要對遺傳算法的早熟問題進行控制,可以選擇引入免疫機制。
按照上述方式,選擇基于遺傳算法的k-means算法,可以有效使k-means算法快速收斂,從而有效減少算法所應用的時間,并獲得最優解,為醫療大數據的數據挖掘奠定基礎。
2.3 應用實例
以基于遺傳算法的k-means算法改進在血液系統疾病費用統計分析為例。在醫院日常營業中,改進后的k-means算法可以根據患者的年齡、性別和患者等信息完成分組,且客觀的顯示血液疾病的分布情況,應用基于遺傳算法的k-means算法改進,可以獲取患者年齡和性別的基礎信息,還可以的對不同年齡和性別分組下的臨床生化指標特征進行解讀,從而相關統計人員能得到目標數據。
將基于遺傳算法改進的k-means算法應用到醫療費用數據的處理。主要是對數據進行分類,并得到初始聚類中心情況,再根據遺傳算法,完成對聚類中心的迭代和更改,并得到最終的聚類結果。通過聚類結果可以將不同類型的血液系統疾病的總例數和具體的治療費用進行展示,從而使得相關結算人員能夠獲得較為準確的費用信息。選擇基于遺傳算法的k-means算法,可以完成對醫療費用的預測,經過檢驗得知,具體預測準確性可以達到92.21%。
3 結束語
結合基于遺傳算法的k-means算法優化,實現對醫療大數據的數據挖掘技術的應用。在血液系統疾病費用的統計分析中,借助化后的算法可以完成對不同血液疾病的病例數和治療費用等信息的獲取,以達到降低醫院治療成本的效果,再為提高醫療服務質量提供有效的數據信息,推動醫院醫療質量水平的提升。借助遺傳算法的數據挖掘技術在提高醫療數據挖掘效率的基礎上,更為直接的提高了數據挖掘的質量,為醫院決策提供數據信息,這是符合現代醫院大數據應用的需求。
參考文獻
[1]張寧,李祥,鹿珂珂.遺傳算法在數據挖掘技術中的應用研究[J].儀表技術,2015(12).
因此在實施大數據分析項目之前,企業不僅應該知道使用何種技術,更應該知道在什么時候、什么地方使用。除了較早前就開始利用大數據的互聯網公司,醫療行業可能是讓大數據分析最先發揚光大的傳統行業之一。醫療行業早就遇到了海量數據和非結構化數據的挑戰,而近年來很多國家都在積極推進醫療信息化發展,這使得很多醫療機構有資金來做大數據分析。因此,醫療行業將和銀行、電信、保險等行業一起首先邁入大數據時代。麥肯錫在其報告中指出,排除體制障礙,大數據分析可以幫助美國的醫療服務業一年創造3000億美元的附加價值。本文列出了醫療服務業5大領域(臨床業務、付款/定價、研發、新的商業模式、公眾健康)的15項應用,這些場景下,大數據的分析和應用都將發揮巨大的作用,提高醫療效率和醫療效果。
臨床操作
在臨床操作方面,有5個主要場景的大數據應用。麥肯錫估計,如果這些應用被充分采用,光是美國,國家醫療健康開支一年就將減少165億美元。
1.比較效果研究
通過全面分析病人特征數據和療效數據,然后比較多種干預措施的有效性,可以找到針對特定病人的最佳治療途徑。
基于療效的研究包括比較效果研究(Comparative Effectiveness Research,CER)。研究表明,對同一病人來說,醫療服務提供方不同,醫療護理方法和效果不同,成本上也存在著很大的差異。精準分析包括病人體征數據、費用數據和療效數據在內的大型數據集,可以幫助醫生確定臨床上最有效和最具有成本效益的治療方法。醫療護理系統實現CER,將有可能減少過度治療(比如避免那些副作用比療效明顯的治療方式),以及治療不足。從長遠來看,不管是過度治療還是治療不足都將給病人身體帶來負面影響,以及產生更高的醫療費用。
世界各地的很多醫療機構(如英國的NICE,德國IQWIG,加拿大普通藥品檢查機構等)已經開始了CER項目并取得了初步成功。2009年,美國通過的復蘇與再投資法案,就是向這個方向邁出的第一步。在這一法案下,設立的比較效果研究聯邦協調委員會協調整個聯邦政府的比較效果的研究,并對4億美元投入資金進行分配。這一投入想要獲得成功,還有大量潛在問題需要解決,比如,臨床數據和保險數據的一致性問題,當前在缺少EHR(電子健康檔案)標準和互操作性的前提下,大范圍倉促部署EHR可能造成不同數據集難以整合。再如,病人隱私問題,想要在保護病人隱私的前提下,又要提供足夠詳細的數據以便保證分析結果的有效性不是一件容易的事情。還有一些體制問題,比如目前美國法律禁止醫療保險機構和醫療補助服務中心(Centers for Medicare and Medicaid Services)(醫療服務支付方)使用成本/效益比例來制定報銷決策,因此即便他們通過大數據分析找到更好的方法也很難落實。
2.臨床決策支持系統
臨床決策支持系統可以提高工作效率和診療質量。目前的臨床決策支持系統分析醫生輸入的條目,比較其與醫學指引不同的地方,從而提醒醫生防止潛在的錯誤,如藥物不良反應。通過部署這些系統,醫療服務提供方可以降低醫療事故率和索賠數,尤其是那些臨床錯誤引起的醫療事故。在美國Metropolitan兒科重癥病房的研究中,兩個月內,臨床決策支持系統就削減了40%的藥品不良反應事件數量。
大數據分析技術將使臨床決策支持系統更智能,這得益于對非結構化數據的分析能力的日益加強。比如可以使用圖像分析和識別技術,識別醫療影像(X光、CT、MRI)數據,或者挖掘醫療文獻數據建立醫療專家數據庫(就像IBM Watson做的),從而給醫生提出診療建議。此外,臨床決策支持系統還可以使醫療流程中大部分的工作流流向護理人員和助理醫生,使醫生從耗時過長的簡單咨詢工作中解脫出來,從而提高治療效率。
3.醫療數據透明度
提高醫療過程數據的透明度,可以使醫療從業者、醫療機構的績效更透明,間接促進醫療服務質量的提高。
根據醫療服務提供方設置的操作和績效數據集,可以進行數據分析并創建可視化的流程圖和儀表盤,促進信息透明。流程圖的目標是識別和分析臨床變異和醫療廢物的來源,然后優化流程。僅僅成本、質量和績效數據,即使沒有與之相應的物質上的獎勵,也往往可以促進績效的提高,使醫療服務機構提供更好的服務,從而更有競爭力。
數據分析可以帶來業務流程的精簡,通過精益生產降低成本,找到符合需求的工作更高效的員工,從而提高護理質量并給病人帶來更好的體驗,也給醫療服務機構帶來額外的業績增長潛力。美國醫療保險和醫療補助服務中心正在測試儀表盤,將其作為建設主動、透明、開放、協作型政府的一部分。本著同樣的精神,美國疾病控制和預防中心(Centers for Disease Control and Prevention)已經公開醫療數據,包括業務數據。
公開醫療質量和績效數據還可以幫助病人做出更明智的健康護理決定,這也將幫助醫療服務提供方提高總體績效,從而更具競爭力。
4.遠程病人監控
從對慢性病人的遠程監控系統收集數據,并將分析結果反饋給監控設備(查看病人是否正在遵從醫囑),從而確定今后的用藥和治療方案。
2010年,美國有1.5億慢性病患者,如糖尿病、充血性心臟衰竭、高血壓患者,他們的醫療費用占到了醫療衛生系統醫療成本的80%。遠程病人監護系統對治療慢性病患者是非常有用的。遠程病人監護系統包括家用心臟監測設備、血糖儀,甚至還包括芯片藥片,芯片藥片被患者攝入后,實時傳送數據到電子病歷數據庫。舉個例子,遠程監控可以提醒醫生對充血性心臟衰竭病人采取及時治療措施,防止緊急狀況發生,因為充血性心臟衰竭的標志之一是由于保水產生的體重增加現象,這可以通過遠程監控實現預防。更多的好處是,通過對遠程監控系統產生的數據的分析,可以減少病人住院時間,減少急診量,實現提高家庭護理比例和門診醫生預約量的目標。
5.對病人檔案的先進分析
在病人檔案方面應用高級分析可以確定哪些人是某類疾病的易感人群。舉例說,應用高級分析可以幫助識別哪些病人有患糖尿病的高風險,使他們盡早接受預防性保健方案。這些方法也可以幫患者從已經存在的疾病管理方案中找到最好的治療方案。
付款/定價
對醫療支付方來說,通過大數據分析可以更好地對醫療服務進行定價。以美國為例,這將有潛力創造每年500億美元的價值,其中一半來源于國家醫療開支的降低。
1.自動化系統
自動化系統(例如機器學習技術)檢測欺詐行為。業內人士評估,每年有2%~4%的醫療索賠是欺詐性的或不合理的,因此檢測索賠欺詐具有巨大的經濟意義。通過一個全面的一致的索賠數據庫和相應的算法,可以檢測索賠準確性,查出欺詐行為。這種欺詐檢測可以是追溯性的,也可以是實時的。在實時檢測中,自動化系統可以在支付發生前就識別出欺詐,避免重大的損失。
2.基于衛生經濟學和療效研究的定價計劃
在藥品定價方面,制藥公司可以參與分擔治療風險,比如基于治療效果制定定價策略。這對醫療支付方的好處顯而易見,有利于控制醫療保健成本支出。對患者來說,好處更加直接。他們能夠以合理的價格獲得創新的藥物,并且這些藥物經過基于療效的研究。而對醫藥產品公司來說,更好的定價策略也是好處多多。他們可以獲得更高的市場準入可能性,也可以通過創新的定價方案,更有針對性療效藥品的推出,獲得更高的收入。
在歐洲,現在有一些基于衛生經濟學和療效的藥品定價試點項目。
一些醫療支付方正在利用數據分析衡量醫療服務提供方的服務,并依據服務水平進行定價。醫療服務支付方可以基于醫療效果進行支付,他們可以與醫療服務提供方進行談判,看醫療服務提供方提供的服務是否達到特定的基準。
研發
醫療產品公司可以利用大數據提高研發效率。拿美國為例,這將創造每年超過1000億美元的價值。
1.預測建模
醫藥公司在新藥物的研發階段,可以通過數據建模和分析,確定最有效率的投入產出比,從而配備最佳資源組合。模型基于藥物臨床試驗階段之前的數據集及早期臨床階段的數據集,盡可能及時地預測臨床結果。評價因素包括產品的安全性、有效性、潛在的副作用和整體的試驗結果。通過預測建模可以降低醫藥產品公司的研發成本,在通過數據建模和分析預測藥物臨床結果后,可以暫緩研究次優的藥物,或者停止在次優藥物上的昂貴的臨床試驗。
除了研發成本,醫藥公司還可以更快地得到回報。通過數據建模和分析,醫藥公司可以將藥物更快推向市場,生產更有針對性的藥物,有更高潛在市場回報和治療成功率的藥物。原來一般新藥從研發到推向市場的時間大約為13年,使用預測模型可以幫助醫藥企業提早3~5年將新藥推向市場。
2.提高臨床試驗設計的統計工具和算法
使用統計工具和算法,可以提高臨床試驗設計水平,并在臨床試驗階段更容易地招募到患者。通過挖掘病人數據,評估招募患者是否符合試驗條件,從而加快臨床試驗進程,提出更有效的臨床試驗設計建議,并能找出最合適的臨床試驗基地。比如那些擁有大量潛在符合條件的臨床試驗患者的試驗基地可能是更理想的,或者在試驗患者群體的規模和特征二者之間找到平衡。
3.臨床實驗數據的分析
分析臨床試驗數據和病人記錄可以確定藥品更多的適應癥和發現副作用。在對臨床試驗數據和病人記錄進行分析后,可以對藥物進行重新定位,或者實現針對其他適應癥的營銷。實時或者近乎實時地收集不良反應報告可以促進藥物警戒(藥物警戒是上市藥品的安全保障體系,對藥物不良反應進行監測、評價和預防)。或者在一些情況下,臨床實驗暗示出了一些情況但沒有足夠的統計數據去證明,現在基于臨床試驗大數據的分析可以給出證據。
這些分析項目是非常重要的。可以看到最近幾年藥品撤市數量屢創新高,藥品撤市可能給醫藥公司帶來毀滅性的打擊。2004年從市場上撤下的止痛藥Vioxx,給默克公司造成70億美元的損失,短短幾天內就造成股東價值33%的損失。
4.個性化治療
另一種在研發領域有前途的大數據創新,是通過對大型數據集(例如基因組數據)的分析發展個性化治療。這一應用考察遺傳變異、對特定疾病的易感性和對特殊藥物的反應的關系,然后在藥物研發和用藥過程中考慮個人的遺傳變異因素。
個性化醫學可以改善醫療保健效果,比如在患者發生疾病癥狀前,就提供早期的檢測和診斷。很多情況下,病人用同樣的診療方案但是療效卻不一樣,部分原因是遺傳變異。針對不同的患者采取不同的診療方案,或者根據患者的實際情況調整藥物劑量,可以減少副作用。
個性化醫療目前還處在初期階段。麥肯錫估計,在某些案例中,通過減少處方藥量可以減少30%~70%的醫療成本。比如,早期發現和治療可以顯著降低肺癌給衛生系統造成的負擔,因為早期的手術費用是后期治療費用的一半。
5.疾病模式的分析
通過分析疾病的模式和趨勢,可以幫助醫療產品企業制定戰略性的研發投資決策,幫助其優化研發重點,優化配備資源。
新的商業模式
大數據分析可以給醫療服務行業帶來新的商業模式。
1.匯總患者的臨床記錄和醫療保險數據集
匯總患者的臨床記錄和醫療保險數據集,并進行高級分析,將提高醫療支付方、醫療服務提供方和醫藥企業的決策能力。比如,對醫藥企業來說,他們不僅可以生產出具有更佳療效的藥品,而且能保證藥品適銷對路。臨床記錄和醫療保險數據集的市場剛剛開始發展,擴張的速度將取決于醫療保健行業完成EMR和循證醫學發展的速度。
2.網絡平臺和社區
另一個潛在的大數據啟動的商業模型是網絡平臺和大數據,這些平臺已經產生了大量有價值的數據。比如PatientsLikeMe.com網站,病人可以這個網站上分享治療經驗;Sermo.com網站,醫生可以在這個網站上分享醫療見解;Participatorymedicine.org網站,這家非營利性組織運營的網站鼓勵病人積極進行治療。這些平臺可以成為寶貴的數據來源。例如,Sermo.com向醫藥公司收費,允許他們訪問會員信息和網上互動信息。