AI语音处理
语音处理
语音转文字,支持多种语言和音频格式,比Whisper快15倍,体验最先进的语音识别技术
选择模型
请选择语音处理模型
处理功能
语音转文字
SenseVoice
支持 MP3, WAV, M4A, FLAC 格式,最大10MB
支持的具体格式
• MP3: .mp3 (MPEG Audio Layer 3)
• WAV: .wav (Waveform Audio File)
• M4A: .m4a (MPEG-4 Audio)
• FLAC: .flac (Free Lossless Audio Codec)
功能说明
- • 支持多语言自动识别(中文、英文、日文、韩文等)
- • 比Whisper快15倍,延迟更低
- • 支持情绪识别和说话人识别
- • 可输出JSON、文本、SRT、VTT等格式
- • 文件大小限制:最大10MB
处理结果
处理结果将在这里显示
还没有处理记录
上传音频文件开始语音转文字