Обучение

Консультация
Консультируем с 8:30 до 19:00Выходной: суббота и воскресенье


Сообщение об ошибке

Обучение

Сообщение об ошибке

Основы Data Science

Профессиональный курс

Курс по Data Science направлен на приобретение знаний, навыков и умений по извлечению, структурированию и использованию полезной информации из неструктурированных, а также разрозненных источников. Он охватывает основные современные средства Data Mining, Machine Learning и Big Data. Использование указанных технологий даёт неоспоримое преимущество не только организациям на рынке товаров и услуг, но и людям на рынке труда.

Описание курса

Формы обучения

Вечерняя

23.02.2019 - Осталось: 33 дня
два занятия в субботу:
с 9.30 до 12.20
с 12.30 до 15.20
2121 BYN
216 уч.ч (шесть месяцев)
Рассрочка шесть выплат 389 BYN/ месяц
В группе конкурс.
Условия по телефону +375445702222
№ группы: M-DS1-02-19

Условия отбора

Зачисление на курс производится на конкурсной основе по результатам:

  • теста по английскому языку;

  • решения задач на языке программирования Python;

  • устного собеседования с преподавателем на знание основ математики.

Для кого этот курс

  • для разработчиков, желающих расширить свои компетенции;

  • для студентов старших курсов и выпускников технических ВУЗов, которые хотят повысить свои шансы на трудоустройство;

  • для аспирантов и соискателей научных степеней, желающих приобрести навыки решения научных и исследовательских задач с использованием современных информационных технологий;

  • для специалистов, желающих повысить свою компетенцию в области Data Mining, Big Data и Data Science.

Необходимая подготовка

Для чего этот курс

Курс предназначен для: 

  • приобретения знаний в областях Data Mining, Big Data и Data Science;

  • формирования устойчивых навыков и умений по постановке и решению аналитических и исследовательских задач с использованием математической статистики и современных информационных технологий, а также разработки информационных рекомендательных систем.

Вы будете уметь

  • осуществлять сбор, обобщение и очистку исходных информационных данных;

  • находить аналитические зависимости в структурированных и неструктурированных данных;

  • осуществлять постановку и решение задач математического программирования и исследования операций;

  • знать и уметь применять основные алгоритмы машинного обучения и математического программирования;

  • знать, как работает Machine Learning;

  • уметь пользоваться основными инструментами Data Mining, Big Data и Data Science;

  • знать основные типы и архитектуру нейронных сетей;

  • реализовывать, внедрять и обучать Machine Learning модели;

  • решать задачи Computer Vision, Natural Language Toolkit, а также прогнозирования временных рядов;

  • знать концепции Map Reduce и CUDA;

  • знать принципы функционирования высоконагруженных систем;

  • разрабатывать рекомендательные системы.

Программа курса

  1. Введение в Data Science
    Объект Data Science.
    Взаимосвязь Data Mining, Big Data и Data Science.
    Инструментарий Data Science.
    Основные способы получения данных.
    Базовый эксплоративный анализ и визуализация данных.
  2. Математические основы Data Science
    Основы матричного исчисления.
    Реализация матричных операций в Python.
    Основы теории вероятности и математической статистики.
    Проверка статистических гипотез в Python.
    Основы математического программирования и исследования операций.
    Классификация алгоритмов математического программирования.
    Визуализация данных в Python.
  3. Основы Data Science и Machine Learning
    Принципы построения моделей в Data Science.
    Метрики качества моделей. Проверка качества модели.
    Введение в Deep Learning и Machine learning.
    Объект Deep Learnig и Machine Learning. Классы решаемых задач.
    Большие данные и параллельные вычисления.
    Подходы к построению высоконагруженных систем.
    Обобщение и сбор данных для обучения их очистка и нормализация.
    Обзор и классификация алгоритмов ML.
  4. Основные алгоритмы Machine Learning
    Алгоритмы «Дерево решений», «Случайный лес», «K-ближайших соседей», «Градиентный бустинг».
    Кластеризация и поиск ассоциаций.
    Линейная и логистическая регрессия. Ограничения, преимущества и недостатки.
    Обучение с учителем.
    Обучение классификатора на размеченных данных.
    Проверка качества модели: переобучение, регуляризация, обучающая и тестовая выборки.
    Борьба с переобучением: ансамблирование. Обзор методов ансамблирования.
    Реализация алгоритмов в Python.
  5. Методы предобработки данных
    Снижение размерности, разреженные данные, многомерные пространства.
    Коррелирующие параметры.
    Нерациональное использование памяти, сложность моделей.
    Статистический анализ данных, выбор параметров на основе корреляции.
    Снижение размерности данных: поиск подмножеств, регуляризация, уменьшение пространства.
    Векторное разложение.
    Методы декомпозиции.
    Спрямляющие пространства.
  6. Рекомендательные системы
    Введение в рекомендательные системы.
    Различие между предсказаниями и рекомендациями.
    Типы рекомендательных систем.
    Постановка целей.
    Неперсонализированные рекомендации.
    Способы построения рекомендательных систем.
    Цепи Маркова.
    Групповые рекомендации.
  7. Распознавание изображений, машинное зрение
    Теоретические основы обработки изображений.
    Форматы данных (RGB, CMYK, B&W), принципы и алгоритмы сжатия изображений, примеры чтения и конвертации изображений.
    Выделение признаков изображений.
    Задача поиска изображения по шаблону, представление свойств изображения с помощью гистограмм.
    Поиск похожих картинок по контенту.
    Сегментация изображений, детекция объектов.
    Детектор лиц на изображении.
  8. Введение в нейронные сети
    Основные элементы нейронных сетей.
    Классификация архитектур нейронных сетей.
    Обучение: функция потерь, обратное распространение ошибки, стохастический градиент.
    Регуляризация.
    Инициализация весов.
    Сверточные нейронные сети.
    Практическое применение сверточных рекурентных и генеративно-конкурирующих сетей в задачах Computer Vision.
  9. Распознавание естественного языка
    Введение в обработку текста.
    Частотный анализ.
    Законы Ципфа и Хипса.
    Морфологический и синтаксический анализ.
    Векторная модель и методы снижения размерности в ней.
    Классификация текстов.
    Извлечение именованных сущностей.
    Языковые модели.
    Извлечение информации.
    Генерация текстов.
  10. Временные ряды
    Временные ряды.
    Модели построения прогнозов.
    Разложение временного ряда на компоненты.
    Автокорреляция и корелограммы.
    Стационарность ряда.
    Сложные модели прогнозирования.
    Прогнозирование временных рядов на цепях Маркова.
  11. Общение с заказчиком. Требования к Data Science проектам
    Cпособы выяснения требований, проверка их выполнимости.
    Формализация и утверждение требований с заказчиком.
    Общий порядок составления отчетов.
    Цели, явные и неявные ожидания заказчиков проекта.
    Описание зависимостей и способов воздействия на важные для заказчика факторы.
    Практический опыт создания хайлоад моделей.
    Выбор алгоритмов, библиотек, тонкой настройки моделей.
  12. Подведение итогов
    Защита дипломных проектов.

Преподаватели курса

  • Роман Сидоренко

    Опыт работы: 8 лет

    Специальность:
    Data Science

    Сфера интересов: С++, Python, MathCard, Mathlab, Wolfram, LPsolve, Statistica, SPSS, R, Computer vision, OpenCv, Apache, Hadoop, Django, Keras, PyAlgoTrade, Machine Learning, Deep Learning, Nltk, NLP, Fasttext, CUDA, Map Reduce ,Cafee, Pytorch, SciPy, NumPy, SkyKit, Theano, Xgboost, libffm.

    Узнать больше

Роман Сидоренко

Специальность:Data Science
Опыт работы:8 лет

Сфера интересов: С++, Python, MathCard, Mathlab, Wolfram, LPsolve, Statistica, SPSS,  R,  Computer vision,  OpenCv, Apache, Hadoop,  Django, Keras, PyAlgoTrade, Machine Learning,  Deep Learning, Nltk, NLP, Fasttext, CUDA, Map Reduce ,Cafee, Pytorch, SciPy, NumPy, SkyKit, Theano, Xgboost, libffm.

Профессиональный путь: В 2005 закончил году Военную Академию Республики Беларусь по специальности «инженер по радио и спутниковым телекоммуникациям». В 2010 году закончил магистратуру этой же академии с присвоением степени магистра технических наук.

С 2011 года занимаюсь научной и исследовательской работой в Научно-исследовательском институте Вооруженных Сил Республики Беларусь. Профессиональная область: разработка и сопровождение, создания и модернизации технических и организационно-технических систем различного назначения.

В 2016 году назначен начальником научно-исследовательского отдела обеспечения геопространственной информацией государственного учреждения «Научно-исследовательский институт Вооруженных Сил Республики Беларусь». 

В 2017 году защитил диссертацию в государственном учреждении «Научно-исследовательский институт Вооруженных Сил Республики Беларусь» с присвоением ученой степени кандидат военных наук.

Мною опубликовано более 20 научных работ, получено 2 патента. В настоящее время присвоено воинское звание подполковник.

Особенности преподавания: Образовательный курс нацелен на приобретение слушателями знаний, умений и навыков, достаточных для самостоятельного улучшения различных процессов, протекающих в бизнес-среде, предприятиях и организациях, с дальнейшей возможностью создания соответствующего enterprise решения или программного продукта.

В современных информационных технологиях повсеместно используются данные об управляющем объекте или процессе. С учетом того, что из года в год объём этих данных увеличивается, а скорость их восприятия человеком относительно постоянна, конкурентные преимущества имеет тот, кто лучше и быстрее извлекает полезную для него информацию. Применение методологии Data Science в программном продукте позволяет значительно повысить его качество и эффективность, что приводит к увеличению прибыли и сокращению затрат организации. Потому руководители предприятия или организации готовы платить немалые деньги тем, кто знает Data Science и умеет  воплощать ее методологию в жизнь.

Для успешного освоения курса слушателям необходимо иметь знания высшей математики на уровне 1-2 курса технического или математического высшего учебного заведения, а также владеть начальными навыками программирования, преимущественно на языке Python.

Оставьте заявку на курс сейчас

Запишитесь на курс сегодня, и уже завтра мы свяжемся с Вами и пригласим на ближайшее вводное занятие.
И конечно, расскажем про полную программу обучения и ее специфику, тренера, а главное – про нашу программу трудоустройства.

Почему выбирают IT-академию?

Более 2140 выпускников успешно работают в IT-компаниях в Беларуси и за рубежом

Акции и новости