ElevenLabs Voice Style
选 voice 之前,先定义用途。很多人试听半天还选不定,不是声音太少,而是没有先想清楚自己到底是在做 brand narration、广告口播、客服语音,还是角色化内容。
先选用途,再选声音
同一个 voice 放在不同场景里,效果可能完全不同。选之前最好先回答:
- 这是一条可信赖的 narration,还是更有表演感的 ad copy
- 是一次性项目,还是长期品牌音色
- 用户会听 10 秒,还是连续听 10 分钟
这三个问题会比“好不好听”更决定结果。
常见的 voice 来源
Default voices:官方维护,适合快速起步Voice Library:选择更多,但要注意风格和权限限制Voice cloning / Voice design:适合角色内容或长期品牌资产
多数团队更实际的起点,不是马上做 cloning,而是先从默认 voice 或 library 里选出 2 到 3 个候选。
试听时真正该听什么
不要只听像不像真人,还要听:
- 长句会不会发飘
- 数字和英文缩写是否清楚
- 情绪会不会过头
- 多段内容之间是否稳定
有些声音第一句很惊艳,但连续听一分钟就开始疲劳,长内容尤其要注意。
model 和 voice 是两层决策
voice 决定气质,model 决定表达方式、稳定性和延迟。
这也是为什么:
- 实时场景不一定适合最强调表现力的路线
- 长旁白不一定适合最戏剧化的声音
一个稳妥的试音方法
用同一段 4 到 6 句的测试 script,连续试听不同 voice。script 里最好包含:
- 一句正常叙述
- 一句带数字或 English term
- 一句需要明显停顿的句子
- 一句带轻微情绪变化的句子