qwen3 tts 语音合成
Qwen TTs
Qwen3 TTS 语音合成 API
Qwen 语音合成模型提供接近真人的自然表达声音,支持多语言及方言,使用单一音色生成多语言内容,并自动适应语气以处理复杂文本。
POST
qwen3 tts 语音合成
概述
Qwen3-TTS 是阿里云通义团队推出的文字转语音模型,支持将文本转化为自然流畅的语音,覆盖 10 种语言,包括中文、英语、日语、韩语、德语、法语、俄语、葡萄牙语、西班牙语和意大利语。提供三种强大模式:音色合成、音色克隆与音色设计。
功能介绍
语音合成:
输入待合成的文本,选择系统内置音色,即可生成语音。支持多语言混合输入。音色克隆:
仅需 3 秒音频,模型即可复刻该音色并朗读您提供的任意文本。克隆效果跨语言同样有效——克隆一段英语音色,即可用于朗读中文内容。音色设计:
用自然语言描述您想要的音色,模型将为您创建对应声音。例如”温暖的讲故事风格,语速舒缓”或”带英国口音的低沉男声”,模型将根据您的描述生成相匹配的语音。语音风格控制:
通过自然语言指令调整语音效果,可控制情感、语速与语气。模型根据文本语义自适应输出,自然停顿并突出重点词汇。查询任务状态
提交任务后,使用统一查询端点查看进度并获取结果:获取任务信息
了解如何查询任务状态及获取生成结果
相关资源
模型概览
探索所有可用模型
通用 API
查看账户剩余积分
授权
所有 API 均需通过 API Key 进行身份验证。
获取 API Key:
- 访问 API Key 管理页面 获取您的 API Key
使用方式: 将以下内容添加至请求头:
x-api-key: YOUR_API_KEY
注意事项:
- 请妥善保管您的 API Key,切勿与他人共享
- 若怀疑 API Key 已泄露,请立即在管理页面进行重置
请求体
application/json
用于生成的模型名称,必填字段。
- 使用本端点时必须填写
qwen3-tts/speech-synthesis
可用选项:
qwen3-tts/speech-synthesis Qwen3 TTS 语音合成任务的输入参数
可选。用于接收任务完成通知的回调 URL。
- 生成完成后,系统将以 POST 方式向该 URL 推送任务状态与结果
- 回调数据结构与任务状态查询接口返回的
data对象一致 - 您的回调端点需支持接收包含结果的 JSON 格式 POST 请求
- 成功接收后需返回 HTTP 200 状态码
示例:
"https://your-domain.com/api/callback"
响应
请求成功
响应状态码
- 200: 成功 - 请求已成功处理
- 401: 未授权 - 身份凭证缺失或无效
- 402: 额度不足 - 账户余额不足以完成本次操作
- 404: 未找到 - 请求的资源或端点不存在
- 422: 验证错误 - 请求参数未通过验证
- 429: 请求限速 - 该资源的请求次数已超出限制
- 455: 服务不可用 - 系统正在维护中
- 500: 服务器错误 - 处理请求时发生意外错误
- 501: 生成失败 - 内容生成任务失败
- 505: 功能已禁用 - 所请求的功能当前已被禁用
可用选项:
200, 401, 402, 404, 422, 429, 455, 500, 501, 505 响应消息,失败时为错误描述
示例:
"success"
