基于LSI的日地空間領(lǐng)域科學(xué)數(shù)據(jù)語(yǔ)義檢索模型
摘要: 日地空間系統(tǒng)科學(xué)的數(shù)據(jù)具有體量大、種類多、結(jié)構(gòu)復(fù)雜的特征,不同概念、不同事件之間的相互關(guān)聯(lián)為該領(lǐng)域內(nèi)的科學(xué)數(shù)據(jù)檢索提出了很高的要求.然而目前該領(lǐng)域內(nèi)依然以基于傳統(tǒng)的關(guān)鍵詞檢索技術(shù)為主,嚴(yán)重影響檢索結(jié)果的質(zhì)量.提出一種數(shù)據(jù)語(yǔ)義檢索模型,它是在對(duì)日地空間學(xué)科元信息提取的基礎(chǔ)上,使用文本處理的方法將提取信息轉(zhuǎn)換為詞項(xiàng)-文檔矩陣,進(jìn)一步使用潛在語(yǔ)義索引技術(shù)對(duì)其進(jìn)行分析,計(jì)算出檢索條目與不同數(shù)據(jù)集的語(yǔ)義相關(guān)度,從而根據(jù)語(yǔ)義相關(guān)度向用戶推薦科學(xué)數(shù)據(jù).實(shí)驗(yàn)對(duì)比表明,該模型的召回率明顯優(yōu)于傳統(tǒng)方法,且具有很高的準(zhǔn)確率.該模型同時(shí)支持對(duì)科學(xué)數(shù)據(jù)進(jìn)行語(yǔ)義標(biāo)注和關(guān)鍵詞提取,亦可用于其他領(lǐng)域科學(xué)數(shù)據(jù)檢索. (共9頁(yè))
開通會(huì)員,享受整站包年服務(wù)