在 iris 数据集中引入 25% 的缺失值,并用 mean 填充 Sepal.Length,用 median 填充 Petal.Length。
Introduce 25% missing values in the 'iris' dataset and impute 'Sepal.Length' with mean and 'Petal.Length' with median.
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: medium
分类: data-preprocessing
标签: R, missing-values, imputation, missForest, Hmisc
参考答案摘要
核心答案 使用 missForest 包引入缺失值: library(missForest) Iris.mis <- prodNA(iris, noNA=0.25) 使用 Hmisc 的 impute 进行填充: library(Hmisc) iris.mis$Sepal.Length <- with(iris.mis, impute(Sepal.Length, mean)) iris.mis$P...
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。