任务 1:数据初步分析 • 对 IRIS 数据集进行描述性统计分析。
- 各特征的均值、方差、偏度、峰度。
- 绘制特征的直方图和箱线图,分析其分布特性。 任务 2:单变量假设检验 • 检验花瓣长度(Petal Length)的均值是否为 4.5(显著性水平 α = 0.05)。
- 假设方差已知,使用 Z 检验。
- 假设方差未知,使用 t 检验。 任务 3:两组比较 • 比较 Setosa 和 Versicolour 两类花的萼片宽度(Sepal Width)的均值是否有显 著差异(显著性水平 α = 0.05)。
- 使用两独立样本 t 检验。
- 判断是否需要假设两组方差相等。 任务 4:参数估计 • 对 Virginica 类别中花瓣长度(Petal Length)的均值和标准差进行估计:
- 使用点估计。
- 构造 95% 置信区间。 任务 5:数据建模与预测 • 假设萼片长度(Sepal Length)服从正态分布。
- 验证假设:使用卡方检验或 Kolmogorov-Smirnov 检验。
- 计算样本中萼片长度落在 [5, 6] 区间的概率。