2009/05/12

爆肝啦

一夜沒睡,沒想到第二天還可以忙到現在才收工。

資料挖掘專題接近完工,希望可以在週四交報告前,把剩下那幾個很鳥的 bug 修掉,這樣這學期最累的工作就結束了,可以好好享受準備研究所的惡夢。


測試記錄:
  •  408 筆對話記錄,共 2812546 字 (增加中)
  • After data cleaning:1393536 字
  • 斷詞數量:13411 筆
  • 斷詞花的時間最久,接下來是讀取 XML,最後才是 k-mean
  • 執行時間:2 小時

沒有留言:

張貼留言