logo

ElevenLabs Script Style

在 ElevenLabs 里,script quality 往往比 voice 选择更先决定结果。模型可以让语音更自然,但它不能把一段本来就像公告通知的文案,自动变成好听的 narration。官方文档现在也明确提到,文本里的情绪描述、标点、停顿和 pronunciation controls 都会直接影响结果,所以 script 其实就是音频质量的一半。

先写“能被念出来”的 script

一个很实用的判断标准是: 你自己大声读一遍,如果会卡、会喘、会找不到重音,AI 大概率也会出问题。

更稳的写法通常是:

  • 句子不要太长
  • 一句只放一个主信息
  • 专有名词提前确认写法
  • 数字、日期和金额写成更容易念的形式

这对教程、课程、广告、播客和品牌旁白都成立。

标点不只是语法,也是在控节奏

ElevenLabs 的最佳实践里对 <break>、省略号、破折号这类停顿控制讲得很清楚。落到实际写法里,可以这样理解:

  • 逗号: 短停顿
  • 句号: 完整收尾
  • 破折号或省略号: 更明显的节奏变化
  • 感叹号: 少量使用,过多会显得太用力

如果你发现生成结果总像赶火车,先别急着怪 voice,先回头看 script 是否写得太满。

情绪控制别靠堆标签

官方现在也提到,文本本身的描述就会影响语音情绪。例如一句话里加上更明确的语气说明,往往比整段堆很多特殊控制更自然。

这类控制更适合处理:

  • 关键句的情绪变化
  • 对话型内容里的角色区分
  • 个别句子的强调方式

真正 production-friendly 的做法,通常不是“每句都调”,而是只在关键句上少量控制。

术语和专有名词要提前处理

如果内容里有产品名、品牌名、地名、英文缩写或技术术语,最好提前做试读。必要时再用 pronunciation dictionary 去控制发音,而不是等整片生成完才发现每次都读错。

尤其是多语言内容,更不能默认一个 voice 会自动把所有专有名词都处理对。

最容易写坏的内容

  • 把文章原文整段贴进去
  • 一句话塞太多信息
  • 术语很多但没提前试读
  • 靠感叹号硬拉情绪
  • 一篇脚本里混太多语言,导致识别和口音都不稳定

一个更靠谱的顺序

  1. 先写清信息结构
  2. 再调句长和节奏
  3. 再决定哪些句子需要强调
  4. 最后才处理 pronunciation 和细节控制

顺序反过来,通常会浪费很多时间在细枝末节上。

ElevenLabs 配音指南
AI Engineer

ElevenLabs 配音指南

ElevenLabs 提供高质量 AI 配音与声音克隆能力,适合视频与课程内容。

ElevenLabs 配音指南脚本与情绪

ElevenLabs Script Style

在 ElevenLabs 里,script quality 往往比 voice 选择更先决定结果。模型可以让语音更自然,但它不能把一段本来就像公告通知的文案,自动变成好听的 narration。官方文档现在也明确提到,文本里的情绪描述、标点、停顿和 pronunciation controls 都会直接影响结果,所以 script 其实就是音频质量的一半。

#先写“能被念出来”的 script

一个很实用的判断标准是: 你自己大声读一遍,如果会卡、会喘、会找不到重音,AI 大概率也会出问题。

更稳的写法通常是:

  • 句子不要太长
  • 一句只放一个主信息
  • 专有名词提前确认写法
  • 数字、日期和金额写成更容易念的形式

这对教程、课程、广告、播客和品牌旁白都成立。

#标点不只是语法,也是在控节奏

ElevenLabs 的最佳实践里对 <break>、省略号、破折号这类停顿控制讲得很清楚。落到实际写法里,可以这样理解:

  • 逗号: 短停顿
  • 句号: 完整收尾
  • 破折号或省略号: 更明显的节奏变化
  • 感叹号: 少量使用,过多会显得太用力

如果你发现生成结果总像赶火车,先别急着怪 voice,先回头看 script 是否写得太满。

#情绪控制别靠堆标签

官方现在也提到,文本本身的描述就会影响语音情绪。例如一句话里加上更明确的语气说明,往往比整段堆很多特殊控制更自然。

这类控制更适合处理:

  • 关键句的情绪变化
  • 对话型内容里的角色区分
  • 个别句子的强调方式

真正 production-friendly 的做法,通常不是“每句都调”,而是只在关键句上少量控制。

#术语和专有名词要提前处理

如果内容里有产品名、品牌名、地名、英文缩写或技术术语,最好提前做试读。必要时再用 pronunciation dictionary 去控制发音,而不是等整片生成完才发现每次都读错。

尤其是多语言内容,更不能默认一个 voice 会自动把所有专有名词都处理对。

#最容易写坏的内容

  • 把文章原文整段贴进去
  • 一句话塞太多信息
  • 术语很多但没提前试读
  • 靠感叹号硬拉情绪
  • 一篇脚本里混太多语言,导致识别和口音都不稳定

#一个更靠谱的顺序

  1. 先写清信息结构
  2. 再调句长和节奏
  3. 再决定哪些句子需要强调
  4. 最后才处理 pronunciation 和细节控制

顺序反过来,通常会浪费很多时间在细枝末节上。

免费资源

精选免费资料与工具合集

课程、工具与资料一站式获取。

查看免费资源 →

相关路线图

常见问题

配音最容易出问题的点是什么?
语速与停顿不自然,建议先调整脚本节奏。
如何保证声音一致?
固定音色与语速设置,并保留模板参数。