Karaoke-Maker API AI 驱动的卡拉 OK 解决方案

使用 AI 歌声提取和音调修正技术,将任何歌曲转换为卡拉 OK 曲目。

输入

string

Input audio file (MP3/WAV)

string

Input vocal-removed audio file (MP3/WAV) for generating instrumental version

string

ASS subtitle file (must contain word-by-word effects)

string

Video resolution (e.g., 1280x720)

boolean

Whether to render audio visualization (disabling this will not render waves/spectrum)

boolean

Whether to force use spectrum when visualization is enabled; otherwise follow viz_type setting

string

Visualization type: waves (waveform, faster) / spectrum (frequency spectrum, slower)

integer

Visualization area height (in pixels)

string

Position: top / bottom / center

string

Color in waves mode (0xRRGGBB or color name); color scheme in spectrum mode (rainbow/moreland/viridis etc.)

number

Visualization layer opacity 0-1

string

Optional: Directory containing required Chinese fonts (TTF/OTF) for ASS font matching

integer

Output frame rate (reducing this value can significantly speed up processing, e.g., 24)

string

x264 encoding preset (ultrafast/superfast/veryfast/faster/fast/medium...)

integer

x264 CRF value (larger value means smaller file size and faster speed, range is usually 18-32, recommended 26-30 for acceleration)

integer

FFmpeg thread count (0 means auto-detect)

integer

Filter graph parallel thread count (0 lets FFmpeg choose automatically)

integer

Visualization layer refresh frame rate (0 means follow the fps value)

string

Optional: Comma-separated list of image paths (jpg/png/webp etc.)

number

Display duration per image (in seconds), only effective when image list is provided

string

Optional: Comma-separated list of video paths (mp4/mov etc.)

boolean

Whether to loop playback when video duration is shorter than audio duration

string

Optional: Title displayed on the first frame of the video

string

Optional: Author displayed on the first frame of the video

输出

卡拉 OK 应用的强大功能

高品质歌声提取

先进的 AI 算法,可从任何音频轨道中精确分离歌声。

实时音调修正

自动音调检测和修正,确保完美的和声效果。

多语言支持

基于多样化数据集训练,支持全球多种语言。

快速处理

优化的推理引擎,几秒内完成处理。

构建卡拉 OK 应用所需的一切

更快地开发卡拉 OK 功能

歌声分离

使用 AI 精度提取或去除歌声。

1

音调修正

自动音调检测和修正。

2

歌词同步

同步歌词与时间数据。

3

批量处理

同时处理多个曲目。

4

快速开始

几分钟内开始使用

准备好构建出色的卡拉 OK 体验了吗?

今天就开始使用免费套餐。

用户评价

加入数千名开发者

Karaoke-Maker API 改变了我们的应用。歌声提取质量令人惊叹。

陈Alex

CTO, SingAlong App

音调修正功能非常准确。用户喜欢专业级的声音效果。

金Sarah

产品经理, MusicFlow

处理速度快,运行可靠。

Johnson Mike

首席开发师, PartyBox

常见问题

您需要了解的一切