基於BERT關鍵詞提取及T5語句生成之資料擴增技術

基於BERT關鍵詞提取及T5語句生成之資料擴增技術

中文題目

基於BERT關鍵詞提取及T5語句生成之資料擴增技術

姓名:鄒明憲

摘要

在自然語言處理領域進行模型訓練,時常發生資料集不足。如何生成大量有效的資料集,是現今的研究課題。本研究整合關鍵詞提取以及語句生成來實現資料擴增。其使用時下最流行的BERT對語句提取最相關的數個單詞並輸入至Text-To-Text Transfer Transformer(T5)進行資料擴增。經過測試後在資料集分佈平均上,獲得了1.12%準確率的提升,為之後的研究奠定良好的基礎。

關鍵詞:人工智慧;自然語言處理;資料擴增

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *