你们的 BERT 是如何做性能与效果优化的?(训练/推理/上线全链路)
How did you optimize BERT in your project (training, inference, and production)?
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: hard
分类: Machine Learning, NLP, MLOps
标签: BERT, optimization, distillation, quantization, serving
参考答案摘要
答案 我会从“目标—手段—权衡”来讲:先明确优化指标(延迟/吞吐/成本/效果/稳定性),再分训练与推理两端处理。 训练侧 数据与任务 :清洗噪声、构造更贴近业务的 domain pretraining/finetune 数据;用对比学习或 hard negative 提升区分度;做 label smoothing、class weight 处理长尾。 训练效率 :混合精度(FP16/BF16)、梯...
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。