一、主要术语
描述统计:研究数据收集、处理和描述的统计学分支。 ....推断统计:研究如何利用样本数据来推断总体特征的统计学分支。 ....
观测数据:在没有对事物进行人为控制的条件下,通过调查或观测而收集到的数据。 ....
实验数据:在实验中控制实验对象而收集到的数据。 ....异众比率:非众数组的频数占总频数的比率。 ....
四分位差:也称为内距或四分间距,上四分位数与下四分位数之差. ....显著性水平:假设检验中发生第Ⅰ类错误的概率,记为。 .....
值:也称观察到的显著性水平或实测显著性水平,是根据样本观测值计算出来的概率。 P-..拟合优度检验:根据样本观测结果与原假设为真条件下期望结果的吻合程度,来检验总体......
是否服从某种分布。一般地,可以用于任何假设的概率分布。 性检验:检验两个分类变量之间是否存在相关关系。 .....
多个总体比例差异检验:检验多个总体比例是否都相等。 ..........消费者物价指数:又称居民消费价格指数,反映一定时期内城乡居民所购买的生活消费品.......
价格和服务项目价格的变动程度的一种相对数。 生产者价格指数:反映企业产品出厂价格变动趋势和变动程度的一种相对数。 .......
股票价格指数:是反映某一股票市场上多种股票价格变动趋势的一种相对 ......
二.简答和计算P41—P42:
2.2比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
概率抽样的特点:简单随机抽样、系统抽样(等距抽样)、分层抽样(类型抽样)和整群抽样。 非概率抽样的特点:方便抽样、定额抽样、立意抽样、滚雪球抽样和空间抽样。
2.6你认为应当如何控制调查中的回答误差?
回答误差是指被调查者接受调查时给出的答案与实际不符。导致回答误差的原因有多种,主要有理解误差、记忆误差及意识误差。
调查一方在调查时可协助被调查者一方共同完成调查,被调查方不了解的调查方可帮助解释、阐明,这样可减少误差。
2.7怎样减少无回答?请通过一个例子,说明你所考虑到的减少无回答的具体措施。 可通过优选与培训采访人员、加强调查队伍管理、准确定位调查对象、保证问卷的送达率等加以预防,采取物质奖励、消除疑虑、提前告知和事中提醒等加以控制,采用多次访问、替换被调查单位、随机化回答技术等方法来降低无回答率。
2.8如何设计调查方案?
第一步:确定调查目的
第二步:确定调查对象和调查单位 第三步:确定调查项目和调查表
第四步:调查表格和问卷的设计 第五步:确定调查时间和调查方法等
1
第六步:调查的计划实施 P77-P78:
3.1为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型;
(2) 用Excel制作一张频数分布表; (3) 绘制一张条形图,反映评价等级的分布。 (4)绘制评价等级的帕累托图。 解:(1)属于顺序数据。 (2)频数分布表如下:
服务质量等级评价的频数分布
服务质量等级 家庭数(频数) 频率%
A 14 14
B 21 21
C 32 32
D 18 18
E 15 15
合计 100 100
(3)评价等级的条形
图如下:
2
(4)评价等级的帕累托图如下:
3.3某百货公司连续40天的商品销售额如下(单位:万元):
41 25 29 47 38 34 30 38 43 46 36 45 37 37 36 45 43 33 35 28 46 34 30 37 44 26 38 42 36 37 37 49 39 42 32 36 根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。 解:频数分布表如下:
某百货公司日商品销售额分组表 按销售额分组(万元) 频数频率(%) (天) 3
40 44 44 35
25~30 30~35 35~40 40~45 45~50 合计 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0 40 100.0 直方图如下:(见Excel练习题2.3)
3.8鉴别图表优劣的准则有哪些?
答:一张好的图表应当:1精心设计,有助于洞察问题的实质2使复杂的观点得到简明、确切、高效的阐述3能在最短的时间内、以最少的笔墨给读者提供最大量的信息4是的5表述数据的真实情况。
3.9制作统计表应注意哪几个问题?
(1)要合理安排统计表的结构,例如行标题、列标题、数字资料的位置,使统计表的横竖长度比例适当,避免出现过高或过长的表格形式。
(2)表头一般应包括表号、总标题和表中数据的单位等内容。总标题应满足3W要求。即统计数据的时间(When)、地点(Where)及何种数据(What)。
(3)表中的上下两条横线一般用粗线,中间的其他线要用细线,这样使人看起来清楚、醒目。 (4)最后在使用统计表时,必要时可在表的下方加上注释,特别要注意注明资料来源,以表示对他人劳动成果的尊重,备读者查阅使用。 P111:
4.11对10名成年人和10名幼儿的身高进行抽样调查,结果如下:单位:CM 成年组 166 169 172 177 180 170 172 174 168 173 幼儿组 68 69 68 70 71 73 72 73 74 75 (1)答:应采用离散系数,因为它消除了不同组数据水平高低的影响。 (2)离散系数公式vss100% x 4
4.2成年组身高的离散系数:vs=172.10.024
2.5v 幼儿组身高的离散系数:s=71.30.035
由于幼儿组身高的离散系数大于成年组身高的离散系数,
说明幼儿组身高的离散程度相对较大。
4.12一种产品需要人工组装,为提高产量,企业准备对现有的组装方法进行改进,现有三种可供选择的组装方法。为确定哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量(单位:个):
方法A 1 167 168 165 170 165 1 168 1 162 163 166 167 166 165 方法B 129 130 129 130 131 130 129 127 128 128 127 128 128 125 132 方法C 125 126 126 127 126 128 127 126 127 127 125 126 116 126 125 (1)你准备采用什么方法来评价组装方法的优劣?
答:应该从平均数和标准差两个方面进行评价。在对各
种方法的离散程度进行比较时,应该采用离散系数。
(2)如果让你选择一种方法,你会作出怎样的选择?试说明理由。 答:下表给出了用Excel计算一些主要描述统计量。
方法A 平均 众数 极差 165.6 平均 中位数 众数 标准差 极差 最小值 最大值 1 8 中位数 165 标准差 2.13 最小值 162 最大值 170 方法B 128.73 平均 129 128 1.75 7 125 132 中位数 众数 标准差 极差 最小值 最大值 方法C 125.53 126 126 2.77 12 116 128 从三种方法的集中趋势来看,方法A的平均产量最高,中位数和众数也都 高于其他两种方法。从离散程度来看,三种方法的离散系数分别为:
2.132.771.750.013v0.014vA=165v, =,=C125.530.022 B128.73.6 5
方法A的离散程度最小。因此应选择方法A。 P206:
7.8从一个正态总体中随机抽取样本量为8的样本,各样本值分别为10,8,12,15,6,13,5,11。求总体均值μ的95%的置信区间。
=0.05,t0.05/2(81)2.365。解:已知:总体服从正态分布,但未知,n=8为小样本,
根据样本数据计算得:x=10,s=3.46。 总体均值的95%的置信区间为:xt23.46s102.,即=102.3658n(7.11,12.)。
7.9某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位;km)分别是:
10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2 假定职工上班的距离服从正态分布,求职职工上班从家里到单位品均距离95﹪的置信区间。 解:已知:总体服从正态分布,但未知,n=16为小样本,=0.05,t0.05/2(161)2.131 根据样本数据计算得:x=9.375,s=4.113。 从家里到单位平均距离的95%的置信区间为:
xt2s4.113=9.3752.131。 9.3752.191,即(7.18,11.57)
14n
P246:
8.2一种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。已知该元件寿命服从正态分布,σ=60小时。试在显著性水平0.05下确定这批元件是否合格。 解:
H0:700,H1:,<700
Z680-70060/36-2<Z0.05,P0.02275
拒绝原假设。
8.4糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9包重量(单位:千克)如下:99.3,98.7,100.5,101.2,
6
98.3,99.7,99.5,102.1,100.5。
已知包重服从正态分布,试检验该日打包机工作是否正常 (α=0.05) ? 解:H0:100,H1:100
x99.978,s1.2122 t99.9781001.2122/90.054<t0.025(99),P0.96212
不能拒绝原假设。
P269:
9.2从总体中随机抽取了n=200的样本,调查后按不同属性归类,得到如下结果:
n1=28, n2=56, n3=48, n4=36, n5=32
依据经验数据,各类别在总体中的比例分别为: 解:
(280.1200)2(560.2200)2(480.3200)2(360.2200)2(320.2200)2140.12000.22000.32000.22000.22002P=0.007295
拒绝原假设。
9.3某报社关心其读者的阅读习惯是否与其文化程度有关,随机调查了254位读者,得到如下数据: 阅读习惯 大学以上 早上看 中午看 晚上看 有空看 6 12 38 21 大学和大专 13 16 40 22 高中 14 8 11 9 高中以下 17 8 6 13 以0.05的显著水平检验读者的阅读习惯是否与文化程度有关。
解:H0:1234(即阅读习惯与文化程度无关),H0:,2,3,4不完全相
2(fofe)等 =31.86
fe2 P=0.000
7
拒绝原假设,认为阅读习惯与文化程度无关。
P424:
13.1下表是1981-199年国家财政用于农业的支出额数据。 要求:(1)绘制时间序列图描述其形态。
不会做
(2)计算年平均增长率。 解:年平均增长率为: Y1085.76Gnn1181113.55%113.55% Y0110.21(3)根据年平均增长率预测2000年的支出额。
ˆ1085.76(113.5%)1232.33 解:Y2000
13.1加EXCEL中的六道题共7题;
13.1 某商业企业2005年下半年各月商品销售额资料如表所示。
某商业企业2005年各月商品销售额
单位:万元 月份 6 7 8 9 10 11 12 销售额 520 540 600 660 760 700 820 计算该企业2005年下半年平均每月的商品销售额。 解:
yyynyy12nn
54060066076070082068068
13.2 某专业学生星期一至星期五出勤人数资料如表所示。
星期五 154
某专业学生出勤资料
星期 星期一 人数(人)
160
星期二 156
星期三 162
星期四 158
计算该专业学生平均每天出勤人数。
解:
yy1y2ynynn160156162158154158513.3某企业2005年4月上旬职工出勤人数如表所示。
某企业2005年4月上旬职工出勤人数
日期
职工出勤人数(人)
1 250
4 262
6 258
8日 266
9 272
计算4月上旬职工人平均每日出勤人数为。
yy1f1y2f2ynfnyff1f2 fn f
25032622258226612722 260 32 212
13.4 某企业2005年第四季度职工人数资料如表所示。
某企业2005年第四季度职工人数资料
日期 月末职工人数(人)
9月30日 250
10月31日 242
11月30日 246
12月31日 244
计算该企业第四季度平均职工人数。 ny
解: y
y122502y2 y3 n 1
242246
41
y n12 2442 245
9
13.5 某商场2005年库存情况如表所示。
某商场2005年库存情况表
日期 商品库存额 (万元)
1月1日 3月1日 7月1日 12月31日 200
220
260
300
计算该商场2005年的月平均库存额。
y1y2 y2y3 y y nf1f2n1fn122 2 解: y f
20022022
22026024 24 6
2603002
6 255
13.6 某企业2005年1—3月份产量计划完程度资料如下表。
某企业2005年1—3月份产量计划程度情况 单位 :件 月份 实际完成a 计划完成b 计划完成(%)c
一月 510 500 102
二月 618 600 103
三月 8 800 108
计算该企业第一季度平均计划完成程度。
y5106188解: a6n3 y b500600800633
n3 a6c104.84%
b633
P443-P444:
14.1某百货公司三种商品的销售量和销售价格统计数据如下: 销售量 单价(元) 商品名称 计量单位 2004 2005 2004 2005 甲 乙 丙 件 盒 个 1800 2400 3500 1300 2600 3800 35.5 15.4 8 43.6 18.5 10 要求:(1)以2004年销售量为权数,计算三种商品的价格综合指数。 解:拉氏价格指数如下:
Ippqpq0100=
43.6180018.5240010.03500157880122.52%
35.5180015.424008.03500128860 (2)以2005年销售量为权数,计算三种商品的价格综合指数。 解:帕氏价格指数如下:
10