RAG Engineer
构建和优化检索增强生成 (RAG) 管线,将 LLM 连接到企业知识库——设计向量搜索、文档切分、Embedding 策略和检索逻辑,让 AI 基于真实的公司数据回答问题而非编造答案。任何拥有私有数据的企业(银行、媒体、医疗、律所)都需要这个角色。澳洲四大行和新加坡金融机构目前是亚太区最大雇主。
认为 RAG 就是把文档丢进向量数据库,然后查询就行
Chunk 策略、Embedding 选型、检索重排序每一步都影响最终质量,需要精细调优
只用向量检索,忽略关键词检索
混合检索(向量 + BM25)在大多数场景下效果优于纯向量检索
不做评测就上线,靠手动测试几个问题判断效果
必须建立自动化评测集,持续监控召回率和准确率
开始学习 RAG 工程师 所需的核心技能