一種基于成詞率和譜聚類的電力文本領域詞發現方法 | |
所屬分類:技術論文 | |
上傳者:aetmagazine | |
文檔大小:544 K | |
標簽: 成詞率 譜聚類 領域詞發現 | |
所需積分:0分積分不夠怎么辦? | |
文檔介紹:考慮到當前電力行業仍缺少有效的領域詞發現方法,以電力行業科技項目文本為原始語料庫,將基于互信息與左右熵的統計特征與傳統語言構詞規則特征相融合,提出了電力文本成詞率的概念。所提方法首先利用成詞率對電力文本進行無監督篩選得到初始候選詞集,然后對候選詞集進行文本切片算法和常用詞過濾操作,最后進行詞嵌入和譜聚類得到最終所需的電力文本領域詞。實驗結果表明,所提出的方法準確有效,為電力文本的領域詞發現提供了一種新方法。 | |
現在下載 | |
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。 |
Copyright ? 2005-2024 華北計算機系統工程研究所版權所有 京ICP備10017138號-2