TensorFlow 里的模型量化(quantization)是什么?
What is model quantization in TensorFlow?
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: medium
标签: Optimization, TensorFlow, Deployment
参考答案摘要
模型量化通过降低权重/激活的数值精度(例如 float32 → int8)来减少模型体积并加速推理,特别适合移动端/边缘设备部署。量化可能带来少量精度损失,因此需要评估性能与精度的权衡。
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。