AudioGPT

3个月前发布 0 0

借助大语言模型（LLM）处理音频的工具

收录时间：

2025-06-09

打开网站手机查看

AI开源项目

AudioGPT

打开网站

这是一个借助大语言模型（LLM）处理音频的工具，可以：
– 生成音乐
– 背景音效
– 音频生成字幕
– 文字生成音频
– 文字生成音频并模拟声音
– 根据图片生成音频
– 对音频进行inpaint（局部屏蔽）
– 根据音频和人脸照片合成视频
– 检测音频中的事件，以及开始和结束时间
– 单声道变双声道
– 通过文本描述检测特定声音发生的时间
– 抽取某种声音
– 去除背景噪音
多人混合声分离出单人声音
语音翻译

http://github.com/AIGC-Audio/AudioGPT
演示：https://huggingface.co/spaces/AIGC-Audio/AudioGPT
论文：https://arxiv.org/abs/2304.12995

暂无评论

暂无评论...

AudioGPT

相关导航

ProPainter

GFPGAN

HivisionIDPhoto

gpt-engineer

Janus Pro 统一多模态理解与生成模型

ChuanhuChatGPT

DragNUWA

LocalAI

暂无评论