基于LSI的代碼-文檔可追溯關(guān)聯(lián)挖掘研究
摘要: 軟件過程產(chǎn)品間可追溯關(guān)聯(lián)挖掘?qū)浖S護(hù)及需求跟蹤等眾多領(lǐng)域至關(guān)重要?;诖?提出一種基于潛在語義索引提取程序代碼和中文文檔關(guān)聯(lián)信息的方法,該方法是對向量空間模型的改進(jìn),通過分析文本間隱含的語義結(jié)構(gòu)來確定關(guān)聯(lián)度,而不依賴于詞項(xiàng)的匹配。實(shí)驗(yàn)結(jié)果表明,該方法不依賴于代碼和文檔預(yù)先定義的同義詞庫和知識庫,并能一定程度上提高查全率和查準(zhǔn)率。 (共3頁)
開通會員,享受整站包年服務(wù)