- 有內建偏差的樣本
- 抽樣的樣本不足以代表全體,有代表性的樣本,這是指把各種偏差來源都排除的樣本。譬如在街頭或是火車站進行隨機的訪問結果,樣本中會明顯少了總是開車出門的樣本。
- 受訪者想要給一個會讓訪問員喜歡的答案,在閱讀調查結果時,一定要把這點列入考慮。譬如:調差薪資的相關問題時,人們常常會高報薪資或低報薪資,為了虛榮感或是拍被查務考慮。
- 精心選擇的平均
- 當你遇到一個平均工資數字,首先要問的是:這是那些人的平均?
- 有人告訴你某個平均數字的時候,你對它還是所知甚少,除非你知道他們所用的廣義平均,是指平均數,中位數,還是眾數
- 有時數據的分佈情況並非是常態分配(鐘形的兩邊對稱),而會是偏斜的(skewed),外形像是溜滑梯,一端急昇一端緩降,此時平均值會離中位數有點距離,以年收入來統計,如果樣本中少數人的收入遠高於其他人,這樣平均值就會被拉高,而中位數較低,就會出現『幾乎每個人都低於平均』。