Back

運用主題模式與廣義線性模式分析教育文本資料之研究

林億雄|國立成功大學永續策略發展處 博士後研究員、國立高雄大學教學與發展中心 助理研究員|11408046@gs.ncku.edu.tw
賴建志|國立高雄大學教學與發展中心專案經理|jjlai@nuk.edu.tw
黃荏渝|國立高雄大學教學與發展中心專任助理|ksu0001@nuk.edu.tw
張志鴻|國立高雄大學應用數學系特聘教授|chchang@nuk.edu.tw

▌摘要

使用主題模式進行教育文本文字資料分析,是自然語言處理一大重要應用領域。隨著教育資源的數位化,透過有效組織、檢索和分析大量的教育文本資料,成為教育研究者面臨的挑戰。主題模式是一種能夠自動提取文本中核心概念的統計方法,能協助教師與教育管理者做出更具數據支持的決策。近年來,隨著人工智慧與機器學習技術的發展,主題模式分析在教育領域的應用日益受到關注,特別是數位線上學習平台的使用,及線上學習評估盛行等。本研究透過爬蟲程式捉取及分析線上討論平台大學生學習評價相關資料,透過主題模式自動化分析技術減少人工標註的時間成本,提高資料處理效率。潛藏狄利克雷分配(LDA)為一種常用的簡易主題模式,已被廣泛應用於文本分類、情感分析和知識管理等領域。本研究探討簡易主題模式 LDA 在教育文本分析中的應用,並透過對教育文本資料進行主題建模,透過簡易主題模式識別學生回饋、課程評價及學科內容中的主要主題。同時,簡易主題模式亦可與廣義線性模型結合使用,結合文本主題分析與量化學生學習結果之間的關聯性。研究結果顯示,LDA 能夠有效擷取出教育文本的核心內容,並能與廣義線性模型結合使用,更能為教育決策者提供有價值的資訊。最後,本文於附錄處提供本研究 LDA 所使用分析中英文文本資料之 Python 語言程式碼,及廣義線性模式使用之 R 統計軟體程式碼,以利有興趣之讀者可加以使用。

關鍵詞:主題模式、教育文本資料、潛藏狄利克雷分配、廣義線性模式