解释一种聚类(Clustering)算法,并说明它适用的场景与局限。
Explain one clustering algorithm and discuss its use cases and limitations.
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: medium
分类: Machine Learning
标签: k-means, unsupervised learning
参考答案摘要
答案 以 K-Means 为例:先选 K 个中心,反复执行“样本分配到最近中心→按均值更新中心”直到收敛。优点是简单高效,适合数值特征、簇近似球形且规模较大的数据。局限包括:需要预先指定 K、对初始中心和异常点敏感、难处理非凸形簇。可用 K-Means++ 初始化、标准化特征、以及轮廓系数/肘部法选择 K 来改进。
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。