以下为2020年江苏自考复习提纲-社会统计学,相关考生注意。
第一章
第一节 社会统计的产生与发展
国势学派:产生于德国,创始人为康令和阿享瓦尔,又可称为记述学派和历史学派。
政治算数学派:创始人是英国人格朗特和威廉 . 配第
数理统计学派:比利时统计学家凯特勒首先将概率论原理引入到社会现象的研究中, 被称为“现代统计学之父”。
战后社会统计工作发生的一系列变化:经济与社会发展计划(法国)该计划规定,要关心经济增长成果的分配和区域发展。
社会指标运动(美国):用社会指标的方法解决社会分析和社会规划的基本理论。
国民经济与社会发展计划(中国)
第二节 社会统计的对象与特点
社会统计学:运用统计学的一般原理, 对社会各种静态结构与动态趋势进行定量描述或推断的一种专门方法与技术。
广义的社会统计学:在我国实际上就是社会经济统计学
狭义的社会统计学:从社会经济统计学中独立出来的社会统计学
第三节 社会统计的方法
描述统计:讨论范围仅以搜集资料本身为限,而不予以扩大。
推论统计:主要是依据概率论, 研究如何依据有限资料对总体性质作推断, 从而使统计的功能大为扩充。
大量观察法 就总体中足够多的单位进行调查并综合分析,用以反映社会总体的数量特征。
大数规律:随机现象出现的基本规律,它的一般意义是:观察过程中每次取得的结果不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。
第四节 社会统计的几个基本概念
总体:作为统计的研究对象的、由许多具有共性的单位构成的整体
总体单位:构成总体的每一个个体被称为总体单位。
总体的基本特征:大量性、同质性和变异性 。
有限总体和无限总体:总体按其包括的单位的数目是有限还是无限, 分为有限总体和无限总体。
样本:通过抽样得到的用以推断总体特征的那个“部分” 。
现实总体:一些看得见摸得着的个体构成
想象总体:想象总体都是无限总体。
标志:说明总体单位属性或数量特征的名称在统计上称为标志。
变量:可变的数量标志能够用数值表示,称之为变量。
连续变量:相邻的两个变量值之间可以连续不断分割的变量。
离散变量:各变量值之间是以整数断开的变量。
自变量:作为变化依据的变量。
因变量:随自变量而发生对应变化的变量。
随机变量:在相同的条件下进行观测,其可能实现的值不止一个
确定性变量:条件一定,可能实现的值确定。
统计指标:反映总体的数量特征的概念或范畴。
社会指标体系:一系列有内在联系的社会统计指标的集合体。
质量指标:说明总体在内涵上的数量特征。
数量指标:说明总体在外延上的数量特征。
社会统计指标体系建立对社会统计学所具有的意义:全面衡量社会发展情况。
第五节 社会统计工作的程序
制定计划统计调查:按照统计研究所预定的目的和任务,运用各种调查的组织形式,有组织、有计划地向调查对象搜集原始资料的工作过程。
统计整理;根据统计研究的目的和任务, 对调查所得的资料进行加工整理, 使之条理化、 系统化。
统计分析
统计报告:将所得结果用文字报告的形式表达出来,以供有关方面参考和利用。
第二章 社会统计资料的搜集
第一节 统计调查的方法及种类
原始资料:指由调查者直接搜集的、未经加工整理而保持其原本状态的资料。
次级资料:指经他人加工整理,可以在一定程度上被引用来说明总体特征的资料。
一般调查和专项调查:(从调查目的上分):一般调查是为了取得用于多种目的的统计数据; 专项调查是为了取得用于研究、分析某些专门问题的统计资料。
全面调查和非全面调查(从调查范围上分):全面调查对构成调查对象的总体中的所有个体进行调查登记,无一遗漏;非全面调查只对构成调查对象的总体中的部分单位进行调查登记。
经常性调查和一次性调查(按调查等级的时间是否连续):经常性调查即连续调查, 是对调查
对象的变化进行连续不断地登记:一次性调查即不连续调查, 是隔一段较长时间进行的调查,但不是指调查只进行一次。
社会统计资料搜集的具体方法
问询法:调查者运用访谈、问卷、电话、通讯等方式,直接或间接向被调查者询问,并根据被调查者的答复取得资料的一种调查方法。
观察法:在现场对调查对象的情况直接观察、记录的一种调查方法。
报告法:以各种原始记录为依据, 由被调查者或单位按照有关规定和隶属关系, 逐级向上提供统计资料的一种方法。
实验法:根据一定的研究目的, 选择一组研究对象, 认为得改变与控制某些因素, 然后观察其后果的一种方法。
文献法:通过记录社会现象的各种载体,从中获取所需信息的一种方法。
第二节 统计调查的组织形式
普查:即全面调查,就是对研究对象的全体作无一遗漏的逐个调查。
重点调查:在研究对象的总体中,选取其中的重点单位进行调查。
典型调查:根据调查的目的和要求, 在对所研究对象进行初步全面分析的基础上, 从中选出有代表性的单位,做周密细致的调查。
抽样调查:把研究对象当做总体,从总体中按随机的原则抽出一定数量的研究单位作为样本,直接调查的对象是样本单位, 收集的资料是样本资料, 然后借助样本指标数值来推算总体指标数。
抽样调查的优点:省时、省力和节省经费。 由于抽样调查范围较小, 调查工作可能做得更加深入细致,减少发生错误的机会,提高资料的可信程度。
简单随机抽样:对总体中所有单位不进行分组只进行编号, 然后组成样本, 赋予总体中每一单位以相同的被抽中的机会。
分层抽样:首先将总体中的所有单位按某种标志顺序排列、 编号,而后从随机选择的第一个单位开始,按照相等的间隔抽取样本单位。
整群抽样:首先将总体单位按其自然形态划分为若干聚类 (群),然后按随机原理, 从成群成组地抽,并对抽中的群或组的所有单位进行全面调查。
系统抽样:将总体单位按某种标志顺序排列、 编号,而后从随机选择的第一个单位开始,按照相等的间隔抽取样本单位。
回置抽样:从总体中抽取一个单位,登记后又放回总体中去,然后再抽下一个单位。
非随机抽样:不严格遵循随机原则的抽样调查。
测量:从研究对象中获取资料或数据的一种观察和登记过程。
测量的四个水平定类尺度:两个属性:对称性和传递性
定序尺度:反对称性和传递性,具有方向性
定距尺度:在这一层次上可以做减法运算,无法做除法运算定比尺度
第四节 统计误差
统计误差:在调查和统计过程中所得到的数据或指标,与客观实际数量特征之间存在的差别。
登记性误差:指在调查和统计过程中由于各种主观因素而引起的技术性、 操作性误差以及由于责任心缘故而造成的误差等。
代表性误差:由于样本资料得到的指标和总体指标之间可能存在的差数, 它可以反映样本在多大程度上代表总体,所以称为代表性误差。
非抽样误差:由于破坏抽样随机原则而产生的系统性、倾向性误差,也称偏差。
抽样误差:在遵守速记原则的条件下,用样本指标代表总体指标不可避免存在的误差。
判断一个抽样方案优劣的主要因素:主要从抽烟精确度和抽样调查费用两个因素考虑。最优的抽样设计方案应当是在既定调查费用的范围内达到最高精确度的方案, 或者是在既定要求的抽样精确度内所耗费用最少的抽样方案。在社会研究中统计误差特别要注意的方面 防止出现非抽样误差;当被调查的主体是人。而对所调查的标志又没有完全不依赖调查者的客观测定方法时, 则调查方式很重要, 否则得不出可靠结果。
第三章 社会统计资料的整理
第一节 统计分组的原则与标准
统计分组:将情况相同或相近的资料加以分门别类的归并, 使之简化明晰, 以便为统计分析提炼各种有用信息打下基础。
统计分组的关键:选择分组标志和划分各组界限
统计分组的原则:分组应使个类别构成之和等于总体; 分组设计应符合现象次数分配的规律性
频数分配列表:在统计资料搜集的基础上,按分组原则,将总体中所有单位依一定的顺序归类整理,即可得到能够表明总体中各单位分部情况的频数分配列表。
品质数列:按品质标志进行分组
变量数列:按数量标志进行分组
第二节 统计表
统计表:表示统计资料的表格, 在由横行、 纵栏交叉结合而成的表格上, 它能系统地组织和
合理地安排大量数字资料。
主词与宾词:主词是统计表所要说明的对象。宾词是用来说明主词的标志和标志值。
统计表格式统计表制作的一般规则:标题部分 栏目部分 线格部分 数字部分 其他
第三节 变量数列 的编制
变量值:用来分组并按大小顺序排列的数量标志的具体数值。
频数:总体单位在各组中出现的次数。
相对频数(频率):将各组频数除以总体单位数
单项式变量数列和组距式变量数列:单项式变量数列是指数列中每一组的变量值都只有一个;组距式变量数列是指数列中每一组由两个变量值差数的一个数值范围来表示。
开口与闭口:有上限而缺下限或有下限而缺上限的组 称开口组;上限和下限齐全的组称闭口
组。
上限、下限和组距:区间距离称为组距;每组的起点数值为下限, 其终点数值为上限, 上限与下限之差就是组距。
组中值:上限与下限之间的中点数值称为组中值。
频率(频数)密度:单位组距内分布的频数
累计频数:分为向上累计和向下累计。组数、组距和全距的关系 组距与组数两者成反比。
第四节 统计图
直方图:用矩形的高度来表示数列各组的频数或频率。
折线图:把直方图各矩形顶部的中点用直线连接气力啊, 并把原来的矩形抹掉, 就得到频数
多变形图
曲线图:对应与连续变量的频数分部的函数关系图。
正态分布:钟形曲线对称分部
偏态分部:非对称分部
洛伦兹曲线:用来反映社会收入分配平均程度的一种累计百分数曲线。
第四章 集中趋势的量度:平均指标
平均指标:表明同质总体在一定条件下某一数量标志所达到的一般水平。
算数平均数的性质:各变量值与算数平均数的离差之和等于 0.
各变量值对算数平均数的离差的平方和,小于它们对任何其他数偏差的平方和。
算数平均数受抽样变动的影响微小,通常它是总体资料集中趋势的最佳量度。
算数平均数受极端值的影响颇大,遇到这种情况时,就不宜用它代表集中趋势了。
分组资料如遇有开放组距是,不经特殊处理将无法得到算数平均数。
中位数:把总体单位某一数量标志的各个数值,按大小顺序排列,位于正中处的变量值。
中位数的性质:(1)各变量值对中位数之差的绝对值总和,小于它们对任何其他数之差的绝对值总和。(2)中位数不受极端值影响( 3)分组资料有不确定组距时,仍可求得中位数。
(4)中位数受抽样变动的影响较算数平均数略大,因此中位数作为总体资料集中趋势的量
度,使用也很广泛。
四分位数:通过三个特定的变量值,可将研究总体中的各单位分割成相等的四部分,这三个分割的变量值就是所谓的四分位数。
众数:在一组资料中,出现次数呈现“峰”值的那些变量值。
位置平均数:众数和中位数被统称为位置平均数。
几何平均数: N 个变量值连乘积的 N次方根。
调和平均数: N 个变量值倒数算数平均数的倒数,也称倒数平均数。
第五章 集中趋势的量度:变异指标
变异指标:用以反映总体各单位的标志值的变动范围或参差程度, 与平均指标相对应, 从另
一个侧面反映总体的特征。
绝对离势和相对离势:变量指标以数量关系来分类可分为两类: 凡用绝对数来表示的变异指标称为绝对离势;用相对数来表达的变异指标称为相对离势。
第一节 全距与四分位差
全距:最大变量值与最小变量值之差,用 R来表示。
四分位差:第三四分位数和第一四分位数的半距,用 Q.D表示。
第二节 平均差
平均差:各变量值对其算数平均数离差绝对值的算数平均数。
平均差的性质:受抽样变动影响、受极端值影响和处理不确定组距方面性质同于算术平均数。平均差不适于代数运算。
第三节 标准差
标准差:各变量值对其算术平均数的离差平方的算术平均数的平方根。
方差:标准差的平方第四节 相对离势
异众比率:指非众数的频数与总体单位数的比值,用 V.R 表示。
变异系数:指绝对离势统计量与其算术平均数的比率,用符号 V表示。
第五节 偏度与峰度的测定
动差:表示频数与变量值对平均数的关系。
原点矩:以原点为中心, 以各组变量值的 k 次方作为力臂的长度, 以各组频率作为作用力的
大小。
偏度:测定频数分布偏斜程度的特征量
峰度:测定频数分布尖平程度的特征量。
第六章 相对指标
相对指标:也称相对数,它是应用对比的方法,将两个有关的指标相除求得的比率。
有名数:由两个性质不同而又有联系的绝对数或平均数对比计算所得的相对数。
无名数:两个有联系的指标对比计算后所得的相对数,只要没有单位,都是无名数。
结构相对数:在分数的基础上,通过部分数值与总体数值的对比来反映各个部分在总体中的
比重。
比较相对数:通过同一时期的连个相同性质数值的对比来说明不同总体或同一总体不同部
分之间的比例关系。
强度相对数:两个性质不同但有密切联系又属于同一时期或时点的绝对数或平均数指标的
对比。