欢迎使用 Crun 模型 API
通过统一 API 探索并集成前沿 AI 模型,覆盖图像生成、视频创作和音频处理等场景。图像模型
面向图像生成、编辑和增强的 AI 模型集合。Google Gemini 图像系列(Nano Banana),支持高质量图像生成和编辑,具备出色的真实感表现和语义理解能力。
Seedream
Seedream 5 和 4.x 图像模型系列,支持文生图生成,在细节渲染和风格一致性方面表现出色。
Flux
Flux 2、Flux Kontext 和 Flux Pro 图像模型,支持文生图和图生图生成,并提供高级构图控制能力。
Qwen
Qwen-Image 和 Qwen-Image-edit 具备强大的通用图像生成与编辑能力,在文字渲染方面表现尤其突出,特别适合中文文字场景。
OpenAI
gpt-image-2 模型支持图像生成与编辑,具备强语义理解能力和高质量输出效果。
Grok Imagine
支持高质量写实图像生成、文生图以及更具创意的图像创作。
视频模型
面向文本和图像生成视频、视频编辑与视频转换的先进 AI 模型。Bytedance
Seedance 2.0 和 Seedance 2.0 Fast 由字节跳动 Seed 团队开发,支持文生视频、图生视频和参考图生视频,可生成 4-15 秒视频,支持音频生成,并具备较强的主体一致性。
Google Veo 是其最强大的视频生成模型系列,原生支持同步音频,可利用 3 张参考图保持一致性,并支持 1080p 输出分辨率。
Wan
阿里巴巴 Wan 系列 AI 视频生成模型支持从文本、音频、图像或参考片段生成高质量、口型同步的 1080p 视频。
Sora2
Sora 是 OpenAI 最新的生成式媒体前沿模型,可根据自然语言或图像创建细节丰富、动态自然且带音频的视频片段。
Vidu
Vidu Q 系列视频模型具备强大的图生视频能力,支持从单张图片、首尾帧图片和多张参考图生成视频。
Grok Imagine Video
Grok Imagine 基于 xAI 的 Aurora 引擎,支持从图像和文本生成 6-30 秒带声音的视频,并提供多种模式以支持更高创意自由度。
语言模型
兼容 OpenAI 接口的大语言模型,适用于聊天、推理、编程和文本生成。OpenAI-Compatible LLM
可通过 OpenAI SDK 或任何已支持
/chat/completions 的客户端接入 CRUN 语言模型。Chat Completions API
OpenAI 兼容
/chat/completions 接口的完整 API 参考,包含请求参数和流式输出说明。音频模型
AI 音频处理能力,包括音乐生成、语音合成、语音识别和音频效果处理。Qwen3 TTS
统一的文本转语音演示,提供 Voice、Clone 和 Design 三种强大模式。
Suno音乐 API
支持 Suno 多种音乐模型,包括最新的Suno V5模型。
快速开始
获取 API Key
访问 API Key 管理页面 获取您的 API 凭证。
最佳实践
所有模型都遵循一致的 API 结构,便于集成和调用。身份验证
所有 API 请求都需要在请求头中携带 API Key。创建任务
所有创建任务请求都使用统一的外层结构。不同模型仅input 字段不同。
响应示例
轮询任务状态
响应示例
回调通知
虽然接口支持轮询,但生产系统中强烈建议使用 webhook 回调。创建任务时如果提供callback_url,请确保:
- 回调地址可通过公网 HTTPS 访问。
- 接口能够快速响应,建议响应时间小于 3 秒,以避免重试。
- 成功接收通知后返回 HTTP 200 状态码。
- 接口具备幂等性。回调通知可能会被投递多次。
积分与定价
不同模型会根据计算资源需求消耗不同数量的积分:- 图像模型:通常每次生成消耗 10-50 积分
- 视频模型:通常每次生成消耗 100-500 积分
- 语言模型:按 token 用量计费
支持
需要帮助选择合适的模型,或需要协助接入 API?- 邮箱:[email protected]
- 文档:请在导航中查看各模型的专属接入指南
