April 2024 – Yudong‘s Blog

CTC Algorithm Explained Part 3：CTC Demo by Speech Recognition（CTC算法详解之语音识别实战篇）

转载本文请注明出处：https://yudonglee.me/ctc-explained-part3 作者：yudonglee 本系列文章总共分为三部分来全面阐述CTC算法（本篇为Part 3）：Part 1：Training the Network（训练算法篇），介绍CTC理论原理，包括问题定义、公式推导、算法过程等。Part 1链接。Part 2：Decoding the Network（解码算法篇），介绍CTC Decoding的几种常用算法。Part 2链接。 Part 3：CTC Demo by Speech Recognition（语音识别实战篇），基于 TensorFlow 实现完整的 CTC 语音识别系统，即本篇。在前两篇文章中，我们分别从理论层面深入剖析了 CTC 的训练算法和解码算法。理论固然重要，但”纸上得来终觉浅，绝知此事要躬行”。本篇将带领读者从零开始，基于 TensorFlow 2.x 搭建一个完整的端到端语音识别系统，将 Part 1 和 Part 2 中的理论知识落地为可运行的代码。本篇的内容组织如下：接下来，让我们一步步开始搭建。 1. 开发环境搭建 1.1… Continue Reading →

2024-04-10 0

Month April 2024

CTC Algorithm Explained Part 3：CTC Demo by Speech Recognition（CTC算法详解之语音识别实战篇）