SiliconFlow Platform

AI语音处理

语音处理

语音转文字，支持多种语言和音频格式，比Whisper快15倍，体验最先进的语音识别技术

选择模型

请选择语音处理模型

处理功能

语音转文字

SenseVoice

上传音频文件

支持 MP3, WAV, M4A, FLAC 格式，最大10MB

支持的具体格式

• MP3: .mp3 (MPEG Audio Layer 3)

• WAV: .wav (Waveform Audio File)

• M4A: .m4a (MPEG-4 Audio)

• FLAC: .flac (Free Lossless Audio Codec)

功能说明

• 支持多语言自动识别（中文、英文、日文、韩文等）
• 比Whisper快15倍，延迟更低
• 支持情绪识别和说话人识别
• 可输出JSON、文本、SRT、VTT等格式
• 文件大小限制：最大10MB

处理结果

处理结果将在这里显示

还没有处理记录

上传音频文件开始语音转文字