網頁

2016年6月10日 星期五

用統計方法來分析文章的用字頻率

Credit: UAB

1949年,哈佛大學的語言學家 George Kingsley Zipf 提出一個經驗公式,說明文章或書本的用字頻率。這個經驗公式相當簡單易懂,卻一直被人懷疑其正確性,因為這個經驗公式一直沒有被仔細的用統計方法驗證過,也沒有被應用在大量的文字資料庫中來驗證其正確性。而且被稱為人類智慧結晶的書籍,真的會有此種用字規律嗎?
這公式是什麼?目前研究情況如何?請點連《用統計方法來分析文章的用字頻率》。

沒有留言:

張貼留言