有效樣本數、抽樣誤差、信賴區(qū)間、信心水準
有效樣本簡單說就是指可信的樣本,抽樣誤差的存在乃因母體中不可避免的特殊樣本,以上兩者皆有統(tǒng)計學上的復雜公式,此處不細表。
反覆投擲銅板,出現正面的機率為p,若投擲n次得到X次的正面,則p大約可用X/n來表示。但是由于p不可能完全等于X/n,因此研究機率者會給p一個范圍,也就是區(qū)號水準(以百分比表示)。d則是抽樣誤差。
因此,有效樣本數應為多少,取決于抽樣誤差與信心水準,三者連動。信心水準是研究者所定的數據,一般被定為95%。再者,抽樣誤差愈小愈好,一般被定為正負3%以內,由此反推有效樣本數。
看民調時,通常有效樣本數是1068份以上,便是按照抽樣誤差與信心水準的數據反推出來的。
按常理,有效樣本愈多,誤差愈小,但因為其投入的成本過大而難以實現,因此民調必然要容許誤差,以降低有效樣本數。
取得1000份有效樣本,并非受訪者只有1000人,依據母體的規(guī)模與復雜度不同,采樣的規(guī)模也不同。有時甚至需要采樣上萬份資料,才能篩選出1000份有效樣本。
分層抽樣與機構效應
抽樣方法很多,于此不一一細表,選舉民調一般采取隨機抽樣,并也搭配分層抽樣。隨機抽樣很好理解,什么是分層抽樣?
舉例,教授想調查某大學學生的消費傾向,設使母體有5000人,為了讓結果更貼近真實,教授分年級采取抽樣,一年級有2000人取樣200人,二年級1500人取樣150人,三年級1000人取樣100人,四年級500人取樣50人。按照母體中不同屬性族群分開處理分別觀察,即稱為分層抽樣。
上述針對各縣市選民結構不同的民調方式,便應采取分層抽樣的方法,較能得出可信的數據。一般而言,政黨內部所做的選區(qū)參考民調,就必須精細到分層抽樣。若是全島性選舉民調,即便是公開的民調也會采取分層抽樣,方能證明其可信度。
機構效應意指做民調的機構因自身立場而對數據產生的干擾,例如,一個“反核”團體做能源政策的民調,能否得出“擁核”支持度較高的數據,基本是可疑的。因為該民團大可在可控范圍內,從母體、有效樣本、抽樣方法、題目設計上誘導出有利于“反核”信念的數據。
由于機構效應的存在,選舉民調嚴重受到干擾,政治立場五花八門的機構,各自做出影響選情的民調,也就不足為奇。“九合一”選舉,凡是政治立場偏綠的民調機構,皆做出與結果偏差度極大的數據,連美國人都上當,即可證明此現象難以消弭。
