基於集合論與圖論之高維度非數值化資料聚類方法-應用於餐飲服務
A New Clustering Algorithm Based on Set Theory
and Graph Theory for High-Dimensional Non-Numeric
Data – An Example of Food Services
姓名:林 聖 爲
過去資料分類方法是將特徵數值化,再利用資料項間距離做為分類依據,但特徵若無法數值化則採樣式(Pattern)來呈現資料項,並採用監督式分類方法,事先挑選訓練資料集加以訓練且無法自動聚類分析。本論文提出一個基於集合論與圖論之高維度非數值化資料聚類方法(A New Clustering Algorithm Based on Set Theory and Graph Theory for High-Dimensional Non-Numeric Data, CASG)將每一資料項利用其特徵構成特徵集合,並將所有資料項轉換一無向圖,再利用所提圖形聚類演算法(Graph Cluster Algorithm)進行聚類分析。此方法對於高維度非數值化資料能有效找出理想的資料分類。實驗結果顯示所提方法比人工推薦更加即時,且準確率可達約 70%,具有高度參考價值。
關鍵詞:聚類分析、圖論、集合論、高維度非數值化資料、圖形聚類演算法。