Deepgram

Deepgram是一个提供先进的AI语音识别和自然语言处理技术的平台,核心产品是强大的语音到文本(Speech-to-Text)和文本到语音(Text-to-Speech)API,让开发者能够快速将语音转录和理解功能集成到他们自己的应用程序和服务中。

Audiobox

Audiobox是Meta推出的免费AI语音和声音生成模型,能结合语音输入和自然语言文本提示生成语音和音效。模型包含Audiobox Speech(专注语音生成)和Audiobox Sound(专注音效生成)等专业模型,底层基于共享的自监督模型Audiobox SSL。

RESEMBLE.AI

RESEMBLE.AI 是基于人工智能技术生成逼真和个性化语音的平台。通过深度学习算法分析真实人类声音样本,学习其独特的发声模式和语言特征,然后根据用户输入的文本生成相似的语音。可以用于多种应用场景,如内容创作、电影和动画产业、广告行业以及个人使用等。

FakeYou

FakeYou 是AI文本转语音平台,用户输入文本,选择喜欢的卡通角色或名人声音,角色能“说出”自己想要的内容。平台支持文本到语音、语音转换、语音克隆等多种功能,且提供零样本语音合成技术,没有大量样本也能生成逼真的声音。

BGM猫

BGM猫是北京灵动音科技有限公司推出的AI智能生成BGM音乐的工具,用户只需选择音乐时长和对应标签工具能自动生成BGM。

快转字幕

快转字幕是由广州比高网络科技推出的一款语音视频转文字字幕的平台,可智能识别音视频内容,将其转录为文字版本。该工具通过先进的语音识别技术,高效省时地为无字幕音视频添加高准确率的字幕,避免了传统手工打字或使用低质量转录工具后所需的繁琐手动校正,提升了自媒体工作者在视频制作中的工作效率。此外,快转字幕不仅提供快速、准确的字幕服务,还支持多种语言和字幕翻译功能,使内容创作者能够更容易地触及全球观众。

悦音配音

悦音配音是制片帮旗下推出的一款AI智能在线配音语音合成工具,可以帮助用户在线将文字输入快速轻松转换成语音。该AI配音工具提供男声、女声、童声、普通话、方言、英文等多种真人声音,在你输入文字后便可以直接智能生成音频。

音虫

音虫SoundBug是一款由国内团队研发的数字音频工作站(DAW)软件,以其简洁直观的用户界面和易于上手的操作特点,为音乐爱好者提供了一套完整的音乐制作工具。SoundBug支持Windows和Mac电脑端使用,内置了AI编曲、丰富的音色库和必要的音频编辑功能。

Mubert

Mubert 是AI音乐生成平台,通过简单易用的方式为用户提供个性化的音乐创作和使用体验。用户可以通过输入关键词(如音乐风格、情绪、场景等)来生成符合需求的免版税音乐,适用于视频背景、播客配乐、商业项目等多种场景。