Школа глубокого обучения (Deep Learning School) — образовательный проект Физтех-школы прикладной математики и информатики МФТИ. Мы учим работе с нейросетями с самых основ до продвинутого уровня. Преподаватели школы — ведущие специалисты российских и зарубежных IT-компаний, научные сотрудники исследовательских организаций, а также выпускники и студенты ФПМИ МФТИ.
По этой форме можно зарегистрироваться на три части нашего курса:
1 часть.
Этот курс предназначен для тех, кто начинает свой путь в мир искусственного интеллекта и глубокого обучения. Вы познакомитесь с ключевыми концепциями машинного обучения, нейронных сетей и их применением в реальных задачах, таких как обработка изображений, семантическая сегментация, детекция объектов и генеративные модели. Курс сочетает теоретические лекции с практическими семинарами.
Для работы с нейронными сетями вы научитесь использовать библиотеку PyTorch, а также познакомитесь с популярными библиотеками: NumPy, Scikit-learn, Matplotlib, Pandas и другими.
2 часть.
Этот продвинутый курс рассчитан на участников, имеющих базовое представление о нейронных сетях и желающих углубить знания в области обработки естественного языка (NLP). Вы познакомитесь с фундаментальными концепциями, такими как рекуррентные нейронные сети, механизмы внимания и трансформеры, а также с современными подходами, включая RAG, интерпретируемость моделей и детекцию сгенерированных текстов.
3 часть.
Этот курс посвящен изучению фундаментальных моделей в CV и NLP.
Курс состоит из трех частей. В первой части вы познакомитесь с архитектурой Vision Transformer и разными ее вариациями. Узнаете, как использовать различные self-supervised подходы для обучения моделей, разберёте модели CLIP и DINO.
Второй блок будет посвящен работе с Vision Language Models.
В третьем блоке вы узнаете про основные подходы в генерации изображений и текста, познакомитесь с диффузионными моделями и flow-matching подходами для генерации. Также разберётесь с диффузионными моделями в непрерывном пространстве, сформулируете и выведете уравнения непрерывности и Фоккера-Планка, которые описывают, как меняется плотность распределения ОДУ/СДУ с течением времени.
Вы также познакомитесь с тем, как развивались фундаментальные модели, и что сейчас является SOTA в генерации картинок.
Speech
Этот курс посвящен современным методам обработки звука и речи (Speech Processing) с использованием машинного обучения. Вы сможете познакомиться с основными способами представления аудиосигналов, фундаментальными задачами обработки речи, такими как автоматическое распознавание речи (ASR) и синтез речи (TTS), а также получите обзор других ключевых направлений.
В курс включены задачи с малоресурсными языками и построение моделей для неанглоязычных данных. В эпоху больших языковых моделей часть курса будет посвящена Speech LLM и мультимодальным LLM, включающим речь. Завершающие недели будут посвящены практическим задачам в аудиодомене.
