社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

分享

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

印度

一周十大热门主题

2025 年程序员薪资水平排行前十的城市 1、北京平均月薪：22,500元年薪范围：35万-...

机器学习学术速递[10.31]

ST成了香饽饽，Python量化验证ST股涨停溢价表现|附策略代码

黑马王炸上新！《神经网络与深度学习》教程发布！

ChatGPT Business 和 Plus 怎么选？超详细开通神器！

图像分类新挑战：从模型鲁棒性到AIGC检测的6大前沿开源数据集

机器学习学术速递[10.30]

张强主持召开工作专题会全力推动微短剧、AIGC产业成为城市发展新引擎

Quant4.0，基于AgentScope开发 | 年化316%，回撤14%的超级轮动策略，附pyt...

哈佛教授免费教材《机器学习系统》-20251029133228

关注

Py学习 » Python

如何使用python使用CTC标记未分段序列语音(wav文件)数据?

Jay • 6 年前 • 625 次点击

你好热情的软件开发人员, 我是语音识别(语音到文本)领域的新手,目前,我正在研究一个项目,我正在使用Mozilla通用语音数据集(德语语音数据集)- https://voice.mozilla.org/en . 我从Mozilla中得到了未经分段的序列数据(mp3文件)和一组tsv文件,它们由声音文件的文本语句组成现在我计划实现CTC标记,使声音文件与相应的文本句子相匹配(这意味着每个字符(而不是每个单词!)需要与其在音频文件中的位置对齐)如何使用python实现CTC标签或者在我的项目中有没有类似的场景可以让我学习和实现? 提前谢谢!!

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/49140

登录后回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)

沪ICP备11025650号