Speech

Материалы Speech курса Deep Learning School (DLS)\

Этот курс посвящен современным методам обработки звука и речи (Speech Processing) с использованием машинного обучения.

Студенты познакомятся с основными способами представления аудиосигналов (wav, spectrograms, continuous embeddings, discrete tokens) , фундаментальными задачами обработки речи, такими как автоматическое распознавание речи (ASR) и синтез речи (TTS), а также получат обзор других ключевых направлений. Также курс включает в себя знакомство с задачей построения моделей для малоресурсных и не английских языков, и в эру больших языковых моделей, часть курса будет посвящена Speech LLM и мультимодальным LLM, включающим речь. Завершающие недели будут посвящены задачам в аудиодомене.

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
images		images
week_01_speech_intro_to_audio		week_01_speech_intro_to_audio
week_02_speech_representations		week_02_speech_representations
week_03_speech_ssl		week_03_speech_ssl
week_04_speech_codecs		week_04_speech_codecs
week_05_speech_asr		week_05_speech_asr
week_06_speech_asr_2		week_06_speech_asr_2
week_07_speech_tts_1		week_07_speech_tts_1
week_08_speech_tts_2		week_08_speech_tts_2
week_09_speech_deepfakes		week_09_speech_deepfakes
week_10_speech_voice_assistant_pipeline		week_10_speech_voice_assistant_pipeline
week_11_speech_low_resource_languages		week_11_speech_low_resource_languages
week_12_speech_llm		week_12_speech_llm
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Speech

Основные материалы

About

Uh oh!

Releases

Packages

Languages

DeepLearningSchool/Speech

Folders and files

Latest commit

History

Repository files navigation

Speech

Основные материалы

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages