分析,总结:对从样本或整个人口中提取的数据集的相关结果的分析、总结和展示
术语“描述性统计”指的是从样本或整个人口中提取的数据集,对相关结果进行分析、总结和展示。描述性统计包括三个主要类别:频率分布、度量集中趋势和可变性的测量。
虽然描述性统计可以提供关于数据集的信息,但它们不允许根据数据分析得出结论,而是提供被分析数据的描述。
频率分布用于定量和定性数据,描述了数据集或样本中不同结果的频率或数量。频率分布通常用表格或图表表示。表或图中的每个条目都伴随着值在间隔、范围或特定组中出现的次数或频率。
频率分布基本上是一种分组数据的表示或总结,根据互斥类和每个各自类的出现次数进行分类。它允许以一种更加结构化和有组织的方式来表示原始数据。
频率分布表示和可视化中常用的图表包括柱状图、柱状图饼图和折线图。
集中趋势是指使用单一值反映数据分布中心的数据集描述性总结。集中趋势的度量也称为中心位置的度量。的意思是,中位数、模式是集中趋势的度量。
平均值被认为是最流行的集中趋势度量,是数据集中的平均值或最常见的值。中位数是指数据集按升序排列的中间分数。模式指的是数据集中最频繁出现的分数或值。
可变性的度量是反映样本中分散程度的汇总统计数据。可变性的度量决定了数据点离中心的距离。
分散性、扩散性和可变性都是指并表示数据集中值分布的范围和宽度。的范围,标准偏差,和方差分别用来描述价差的不同组成部分和方面。
范围描述了数据集中的离散程度或最大值和最小值之间距离的理想值。标准偏差用于确定一组数据中的平均方差,并提供对数据集中的值与同一数据集的平均值之间的距离或差异的洞察。方差反映了扩散的程度,本质上是平方偏差的平均值。
要更深入地了解不同的基本统计概念和工具,请查看CFI的统计数据基础课程!
描述性统计使得数据可视化更加容易。它允许以一种有意义的、可理解的方式表示数据,这反过来又允许对相关数据集进行简化解释。原始数据将很难分析,趋势和模式的确定可能具有挑战性。此外,原始数据使可视化数据所显示的内容具有挑战性。
考虑下面的例子:
每门课程有100名学生报名。为了了解参加各模块的学生的整体表现和分数的分布情况,必须使用描述性统计。将分数作为原始数据来获取,将证明对整体表现和分数分布的确定是具有挑战性的。
此外,描述性统计可以通过结合表格和图形描述以及对发现的结果的讨论来总结和展示数据集。描述性统计用来总结复杂的定量数据。
感谢您阅读CFI的描述统计指南。为了继续推进你的职业生涯,下面的额外资源会很有用: