摘要:隨著信息化建設(shè)的快速發(fā)展,數(shù)據(jù)產(chǎn)生了爆炸式的增長,醫(yī)院每天也同樣產(chǎn)生大量的醫(yī)療記錄與數(shù)據(jù)。其中大部分內(nèi)容是非結(jié)構(gòu)化數(shù)據(jù),具有真實(shí)性、主觀性和不規(guī)范性,不利于解讀和處理。由于醫(yī)療數(shù)據(jù)是以非結(jié)構(gòu)化的文本形式存儲的,因此無法直接通過計(jì)算機(jī)直接處理和分析,不僅效率低下,分析質(zhì)量也無法保證。目前的信息抽取研究中使用的方法的可擴(kuò)展性都較差,具有一些局限性,故自動化程度不高。文中通過自然語言處理中的規(guī)則描述語言方法,對數(shù)據(jù)中非結(jié)構(gòu)化的醫(yī)學(xué)命名實(shí)體進(jìn)行識別,并通過語義分析進(jìn)行標(biāo)簽提取,使非結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu)化,讓數(shù)據(jù)中的描述更為準(zhǔn)確、統(tǒng)一。優(yōu)化了目前信息抽取方法中存在的可擴(kuò)展性差的缺點(diǎn),能夠根據(jù)情況適應(yīng)不同的情景。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社。
計(jì)算機(jī)技術(shù)與發(fā)展雜志, 月刊,本刊重視學(xué)術(shù)導(dǎo)向,堅(jiān)持科學(xué)性、學(xué)術(shù)性、先進(jìn)性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:綜述評論、人工智能、信息安全、經(jīng)驗(yàn)交流、研究探討、開發(fā)應(yīng)用、網(wǎng)絡(luò)通信、學(xué)習(xí)園地等。于1991年經(jīng)新聞總署批準(zhǔn)的正規(guī)刊物。