What you'll learn
- 了解seq2seq序列网络模型
- 学习LAS模型语音识别实战
- 掌握starganvc2变声器论文原理和源码实战
- 掌握语音分离ConvTasnet模型
- 掌握语音合成tacotron最新版实战
Requirements
- 具备Python基础知识
Description
语音识别是深度学习中的经典算法项目,为此我们邀请到了在深度学习领域深耕多年的唐宇迪老师,采用通俗易懂的方式解读语音分析领域必备论文,帮助学员深入理解语音识别领域四大核心模块:语音识别、语音分离、语音转换、语音合成。每个模块从论文原理解读、架构解析到实战演示项目实际流程细节,从零开始轻松掌握语音识别核心算法模型。
本节课包括seq2seq序列网络模型、LAS模型语音识别实战、starganvc2变声器论文原理解读、变声器源码实战、语音分离ConvTasnet模型、ConvTasnet语音分离实战、语音合成tacotron最新版实战。完成之后不但可以掌握语音识别领域核心算法构建方法,还可以将学到的内容熟练应用于实际项目中。
Who this course is for:
- Python工程师、AI工程师
- 人工智能、深度学习方向的技术人员
- 对语音识别感兴趣的技术人员
Instructors
三节课官方账号
三节课作为中国领先的数字化人才战略服务商,面向企业和个人用户提供以“内容+服务+平台”为核心的数字化人才战略解决方案。面对企业客户我们提供以“解决业务问题”为目标的人才体系搭建和培养,面对个人用户提供以“职业发展”为目标的体系化课程和服务。
三节课在多个客户行业中的市场占有率均位居前列,业务覆盖互联网、金融、教育、通信、汽车、地产、零售、制造等多个行业。创办至今已服务包括阿里、腾讯、字节跳动、中国移动、招商银行、平安、华为、海尔、一汽、好未来以及众多国内外知名企业在内的2000多家大中型客户,300多万学员,深受客户认可和好评。
三节课总部位于北京,在天津、上海、深圳均设有分公司,员工近400人。成立至今已获得IDG、险峰长青、双湖资本等重量级明星机构的青睐,2019年完成B轮1.3亿融资,公司估值超10亿元!在数字化浪潮的席卷下,三节课始终坚持“以人为本”,为整个社会的数字化转型和人才培养赋能。