logo

你提到的 Facebook 召回论文里,样本是怎么挖掘的?easy / hard 样本配比一般怎么做?

In a Facebook-style retrieval paper, how are samples mined and how do you balance easy vs hard negatives?

题目类型: 技术面试题

这是一道技术面试题,常见于澳洲IT公司面试中。

难度: hard

分类: Machine Learning, Recommendation, Search

标签: hard-negative, easy-negative, sampling, ANN

参考答案摘要

答案 如果面试官指的是“工业级召回/匹配”论文,我会先确认是哪一篇,然后回答通用做法:样本通常来自日志(曝光/点击/停留/转化),正样本是高置信行为,负样本则通过多策略挖掘。 常见挖掘方式 Easy negatives :随机采样(同 batch/同时间窗/同用户未点击曝光),训练稳定、覆盖面大。 Hard negatives :用 ANN/近邻检索从候选里挑“模型当前最像但未点击”的样本;或用同...

本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。

← 返回面试题库

你提到的 Facebook 召回论文里,样本是怎么挖掘的?easy / hard 样本配比一般怎么做?

Hardretrievalnegative-samplinghard-negative-mining

想查看完整答案?

登录匠人学院学习中心,获取 STAR 格式回答和详细技术解析

前往学习中心查看答案