logo
70

统计分析

⏱️ 45分钟

统计分析入门:从“看数据”到“解释数据”

你现在可能会困惑什么

“平均值高不就说明表现好吗?”

不一定。还要看离散程度与样本规模。

一句话定义

统计分析用均值、中位数、方差、标准差描述数据分布并支持判断。

生活类比

两个班均分都 80,但一个稳定一个波动大,结论不同。

最小可运行例子

import statistics
data = [80, 90, 78, 92, 88]
print(statistics.mean(data))
print(statistics.median(data))
print(statistics.stdev(data))

课堂小测(5 分钟)

  1. 计算两组数据均值和标准差。
  2. 比较哪组更稳定。
  3. 写简短结论。

课堂小测参考答案与判分点

  • 参考答案方向:能写出可运行代码,并覆盖题目中的核心条件与边界输入。
  • 判分点 1(正确性):主流程结果正确,关键分支可执行。
  • 判分点 2(可读性):变量命名清晰,结构不过度嵌套。
  • 判分点 3(健壮性):对空值、类型错误或异常输入有基础保护。

迁移任务(课后)

实现 analyze_scores(scores) 返回结构化统计结果。

本节验收标准

你能独立做到:

  • 计算核心统计指标
  • 解释指标含义
  • 避免单指标误判

常见报错与调试步骤(新手版)

  • 报错看不懂:先读最后一行错误类型(如 TypeErrorNameError),再回到对应代码行定位。
  • 不确定变量值:在关键位置临时 print(变量, type(变量)),先确认数据是否符合预期。
  • 改了代码却没生效:确认文件已保存、运行的是当前文件、终端环境(venv)是否正确。

常见误区

  • 误区:只看均值下结论。
  • 正解:结合方差/标准差与样本量。