社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

如何使用python使用CTC标记未分段序列语音(wav文件)数据?

Jay • 5 年前 • 578 次点击  

你好热情的软件开发人员, 我是语音识别(语音到文本)领域的新手,目前,我正在研究一个项目,我正在使用Mozilla通用语音数据集(德语语音数据集)- https://voice.mozilla.org/en . 我从Mozilla中得到了未经分段的序列数据(mp3文件)和一组tsv文件,它们由声音文件的文本语句组成现在我计划实现CTC标记,使声音文件与相应的文本句子相匹配(这意味着每个字符(而不是每个单词!)需要与其在音频文件中的位置对齐)如何使用python实现CTC标签或者在我的项目中有没有类似的场景可以让我学习和实现? 提前谢谢!!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/49140
 
578 次点击