问项目:你们的bert是如何优化albert创新点阅读过召回相关论文吗facebook那篇论文样本如何挖掘的,easy和hard样本配比怎样损失函数的优化batch内负样本有了解吗,为什么不用hinge loss NCE loss 等pairwise loss问基础:减轻过拟合的方法l1和l2正则区别l1为什么能得到稀疏解dropout如何做的bn和lnlightgbm优化点互斥特征捆绑如何实现的逻辑题:猴子搬香蕉coding:二叉树的非递归后序遍历