Mô tả

基于深度学习的语音识别实战课程主要包括三部分内容:1.经典论文算法讲解;2.算法源码解读;3.项目实战;通俗讲解语音识别领域当下经典论文思想,详细解读源码中每一核心模块并基于真实数据集展开项目实战。整体课程覆盖语音识别领域四大核心主题:语音识别,语音分离,语音转换,语音合成;每一主题均按照论文思想解读,源码分析,项目实战顺序进行讲解。提供课程所需全部数据集,代码,PPT课件。

Bạn sẽ học được gì

掌握语音经典算法及其应用领域

熟练使用PyTorch框架构建语音识别模型

掌握语音识别领域经典论文算法

熟悉语音数据预处理方法

熟练使用深度学习框架进行语音识别任务开发

熟悉语音分离技术落地方案

熟练使用PyTorch框架构建语音分离模型

掌握语音合成最新论文及其算法思想

熟练使用PyTorch构建语音合成模型

掌握变声器构建原理及其应用

熟练使用PyTorch框架构建变声器模型

Yêu cầu

  • 熟悉Python与深度学习基本算法

Nội dung khoá học

12 sections

seq2seq序列网络模型

8 lectures
课程简介
07:46
序列网络模型概述分析
08:57
网络工作原理概述
03:51
注意力机制的作用
06:00
加入attention的序列模型整体架构
09:23
TeacherForcing的作用与训练策略
07:11
额外补充-RNN网络模型解读
11:52
本章课件下载
00:00

LAS语音识别模型实战

10 lectures
数据源与环境配置
08:39
语料表制作方法
05:33
制作json标注数据
09:20
声音数据处理模块解读
11:11
Pack与Pad操作解析
10:00
编码器模块整体流程
07:10
加入注意力机制
07:46
计算得到每个输出的attention得分
09:34
解码器与训练过程演示
08:38
本章课件下载
00:00

starganvc2变声器论文原理解读

7 lectures
论文整体思路与架构解读
07:26
VCC2016输入数据
07:26
语音特征提取
11:38
生成器模型架构分析
05:11
InstanceNorm的作用解读
07:30
AdaIn的目的与效果
05:08
判别器模块分析
13:10

starganvc2变声器源码实战

12 lectures
数据与项目文件解读
07:00
环境配置与工具包安装
08:02
数据预处理与声音特征提取
13:46
生成器构造模块解读
09:07
下采样与上采样操作
07:54
starganvc2版本标签输入分析
06:00
生成器前向传播维度变化
07:03
判别器模块解读
07:49
论文损失函数
08:02
源码损失计算流程
06:07
测试模块-生成转换语音
09:05
本章课件下载
00:00

语音分离ConvTasnet模型

6 lectures
语音分离任务分析
03:32
经典语音分离模型概述
07:05
DeepClustering论文解读
05:53
TasNet编码器结构分析
10:38
DW卷积的作用与效果
04:26
基于Mask得到分离结果
05:51

ConvTasnet语音分离实战

9 lectures
数据准备与环境配置
11:19
训练任务所需参数介绍
07:10
DataLoader定义
04:57
采样数据特征编码
07:22
编码器特征提取
07:19
构建更大的感受区域
10:01
解码得到分离后的语音
06:39
测试模块所需参数
03:57
本章课件下载
00:00

语音合成技术概述

2 lectures
语音合成技术概述
05:44
语音合成技术概述
09:43

语音合成tacotron最新版实战

13 lectures
语音合成项目所需环境配置
09:03
所需数据集介绍
04:34
路径配置与整体流程解读
09:03
Dataloader构建数据与标签
11:54
编码层要完成的任务
08:08
得到编码特征向量
06:41
解码器输入准备
08:05
解码器流程梳理
09:07
注意力机制应用方法
08:32
得到加权的编码向量
10:14
模型输出结果
09:47
损失函数与预测
06:27
本章课件下载
00:00

基础补充-PyTorch框架基本处理操作

9 lectures
PyTorch框架发展趋势简介
08:25
框架安装方法(CPU与GPU版本)
05:13
PyTorch基本操作简介
09:25
自动求导机制
10:59
线性回归DEMO-数据与参数配置
08:56
线性回归DEMO-训练回归模型
10:08
常见tensor格式
07:10
Hub模块简介
08:25
本章课件下载
00:00

PyTorch使用补充-神经网络实战分类与回归任务

6 lectures
气温数据集与任务介绍
06:42
按建模顺序构建完成网络架构
11:38
简化代码训练网络模型
11:04
分类任务概述
05:12
构建分类网络模型
09:40
DataSet模块介绍与应用方法
10:11

算法补充-卷积神经网络原理与参数解读

12 lectures
卷积神经网络应用领域
07:25
卷积的作用
09:23
卷积特征值计算方法
08:07
得到特征图表示
06:59
步长与卷积核大小对结果的影响
08:11
边缘填充方法
06:30
特征图尺寸计算与参数共享
07:02
池化层的作用
05:38
整体网络架构
06:20
VGG网络架构
06:16
残差网络Resnet
07:41
感受野的作用
05:46

策略补充-迁移学习与Resnet网络架构

8 lectures
迁移学习的目标
05:31
迁移学习策略
07:11
迁移学习策略
11:54
Resnet网络细节
12:41
Resnet基本处理操作
06:17
shortcut模块
08:31
加载训练好的权重
07:01
迁移学习效果对比
09:01

Đánh giá của học viên

Chưa có đánh giá
Course Rating
5
0%
4
0%
3
0%
2
0%
1
0%

Bình luận khách hàng

Viết Bình Luận

Bạn đánh giá khoá học này thế nào?

image

Đăng ký get khoá học Udemy - Unica - Gitiho giá chỉ 50k!

Get khoá học giá rẻ ngay trước khi bị fix.