首頁 > 期刊 > 自然科學與工程技術 > 信息科技 > 計算機軟件及計算機應用 > 中文信息學報 > 基于主述位理論的漢語基本篇章單元識別 【正文】
摘要:基本篇章單元(Elementary Discourse Units,EDU)識別對篇章分析工作意義重大,是構建篇章結構的基礎。從篇章銜接性視角看,每個EDU都由要表達信息的起始點--主位和要傳達的新信息--述位兩部分構成。該文結合已有研究和漢語實際情況,給出了一個基于主述位理論的漢語基本篇章單元識別方法。該方法將EDU識別轉化為主述位識別問題,由主位、述位的位置間接地確定EDU的邊界,最終完成EDU的識別。而主、述位間具有明顯的信息序列化特征,因此可通過序列化標注方法進行。基于主述位理論的漢語基本篇章單元識別方法更關注EDU作為一個獨立的篇章單元的內部構成,在漢語篇章話題結構語料庫CDTC上的實驗也進一步驗證了該方法的有效性,EDU識別的性能F1值達到了89.46%。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社