文本描述
抽样及其控制-定量研究的第一步
speaker:朱永明 抽样设计过程
抽样方法
样本量计算
抽样误差计算与控制(抽样加权控制)
访问信度计算与控制 目录 抽样方法(samplingmethod) 非随机抽样(Nonprobabilitysampling)
随机抽样(probabilitysampling) 抽样设计过程 定义抽样总体 决定抽样框 选择抽样技术 决定抽样规模 执行抽样过程 在12个居委中,共有6000户,分布情况为: 将12个居委在1—6000内编号,然后抽选居委的方法为:
一、随机抽选两个数,如696和1812,则选出居委3和4
二、计算间距K=6000/2,然后在1—k之间选取一个随机数R,
最终抽选的号码为R,R+K。如R=705,选样号码为:
705,705+3000=3705,则第3、10居委中选。 PPS抽样的一个例子 项目中抽样工作流程 定义抽样总体决定抽样框 确定抽样方法 确定样本量 抽样实施 入户访问 按人口比例确定各行政
区的样本居委会数量 确定每一个居委会
样本户数量 确定样本居委会数量 抽取样本居委会
及样本户 递补原则 按居委会抽样:递补时访问样本户右手
边的下一户 划地块抽样:递补时按原有抽样原则继续抽样,
即采用一定的抽样间距从最后
一个样本户开始继续抽样。 街头定点访问 电话访问 确定抽样框 确定抽样方法 抽取样本 访问时的控制 如何确定样本量 n样本规模
t概率度(一般置信度95%时,t=1.96,如置信度为99%,t=2.6)
Δ极限统计误差
p为总体比例
s总体元素分布标准差 简单随机样本量的计算公式 比例抽样案例计算 在广州进行一项抽样调查以了解某种新服务方式的接受度,根据厂家反映,接受度为30%,厂家要求在95%的置信度下统计误差范围不超过正负4%,因此简单随机抽样的样本量为:
1.96×1.96×30%×(1-30%)/(4%×4%)
=504 标准差=差、方、均(Root-Mean-Square)
如:20,10,15,15的标准差为:
平均值=(20+10+15+15)/4=15
标准差=((20-15)2+(-5)2+02+02)/4=3.5
均值抽样案例计算 例如:要了解某城市的居民收入,假定
我们知道该市居民收入的标准差
为1500元,要求的调查误差不超
过100元,则在95%的置信水平下,
所需的样本量为:
n=1.962*15002/1002=864 均值抽样案例计算 分析要求 全国性的还是分城市的或者是分区的
城市内是否要进一步按职业或企业类型等
变量细分,分析是否详尽(三层至四层)
是否用高级统计分析方法
80%以上的细胞中不少于30个样本量
是否要做预测
是否使用模型
同类项目经验
研究类型最小规模典型规模
问题识别研究(如市场潜力)5001000-2500
问题解决研究(如产品定价)200300-500
产品测试研究200300-500
广告效果研究150200-300
产品市场跟踪研究10个商店10-20个商店
集体访谈(FocusGroup) 2组 4-12组 样本量的误区 有人回答不准确,所以样本量再大也没有用
电视上只调查几十个人就够了,我们也可以
样本量越大越好
这么大的城市,怎么也要好几千人才行
大城市多抽,小城市少抽
上次调查这么多人,这次也这么多吧
能省钱就省钱,先这么着吧,估计差不多吧
我们做了这么大量的问卷,结果肯定准确