logo

在 iris 数据集中引入 25% 的缺失值,并用 mean 填充 Sepal.Length,用 median 填充 Petal.Length。

Introduce 25% missing values in the 'iris' dataset and impute 'Sepal.Length' with mean and 'Petal.Length' with median.

题目类型: 技术面试题

这是一道技术面试题,常见于澳洲IT公司面试中。

难度: medium

分类: data-preprocessing

标签: R, missing-values, imputation, missForest, Hmisc

参考答案摘要

核心答案 使用 missForest 包引入缺失值: library(missForest) Iris.mis <- prodNA(iris, noNA=0.25) 使用 Hmisc 的 impute 进行填充: library(Hmisc) iris.mis$Sepal.Length <- with(iris.mis, impute(Sepal.Length, mean)) iris.mis$P...

本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。

← 返回面试题库

在 iris 数据集中引入 25% 的缺失值,并用 mean 填充 Sepal.Length,用 median 填充 Petal.Length。

Mediumalgorithms

想查看完整答案?

登录匠人学院学习中心,获取 STAR 格式回答和详细技术解析

前往学习中心查看答案