和记平台

最新发布!查看 MagicData 成品数据集
语音复刻大模型高品质数据集——东南亚

语音复刻大模型高品质数据集——东南亚

语种

他加禄语-菲律宾,马来语-马来西亚,泰语-泰国

数据风格

对话式&朗读式

音频格式

PCM

采样率

48kHz

比特率

16 bits

声道

1

人数

5,232

时长

2,425

As a new trend of AIGC, zero-shot speech synthesis has wide-ranging applications, including voice assistants, audiobooks, video game character voices, creating podcast, and real-time voice changer, among others. has proactively designed and developed the "High-Quality Dataset for Voice Replication," which boasts a 48kHz high sampling rate, tens of thousands of contributors with diverse content, making it an excellent resource for achieving zero-shot speech synthesis.

没有找到想要的数据?

联系我们

数据集推荐

MDT-AF057 中文中老年朗读音频数据集

试听音频

MDT-AF055 中文普通话朗读音频数据集

试听音频

MDT-AE016 菲律宾英语朗读音频数据集—日常用语

试听音频

噪音音频数据集

该数据集广泛涵盖了多种噪音环境类型,包括但不限于飞机场的嘈杂声、火车站的人声鼎沸以及咖啡厅的背景声等场景。
试听音频

MDT-AG030 湖南重口音普通话音频数据集

试听音频

MDT-AD017 日语手机朗读数据库

MagicData拥有1500小时日语语料库,本次开源30小时数据集作为测试集。本语料库的录制文本为日常用语。采集方式为手机录音;录音输出为PCM格式。37名来自日本不同区域(如东京、大阪、北海道等)的发言人参与采集。MagicData日语手机朗读数据库(30小时)由MagicData有限公司开发,免费发布供非商业使用。 研发制作了朗读、面对面对话、电话对话等多场景下的中文、英文、日语、韩语等数十种语言的语音数据库。该数据库得到了行业的广泛认可。如您想了解更多爱数数据库信息,欢迎您联系我们。

数据优势有哪些?

合规性

符合ISO/IEC 27001和ISO/IEC 27701:2019标准认证

多维度

音频、文本、图像、音视频多模态数据

覆盖性

涵盖多领域的对话式、朗读式及自发式数据

高精度

人机协同高精度标注

TOP
联系我们
Sitemap