[Нетология] Профессия - Data Scientist (2019)

Уверенная в себе
Команда форума
Редактор
Премиум
Активный участник
Регистрация
13 Июл 2018
Сообщения
7.050
Реакции
298.681
Монетки
143089
    Голосов: 0
    0.0 5 0 0 https://tor.sharewood.pro/threads/%D0%9D%D0%B5%D1%82%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D1%8F-%D0%9F%D1%80%D0%BE%D1%84%D0%B5%D1%81%D1%81%D0%B8%D1%8F-data-scientist-2019.38311/
  • #1
Автор: Нетология
Название: Профессия - Data Scientist

Мощнейший курс по программированию от Нетологии. В сети были некоторые части материала, которые вызывали дикий восторг у людей. В этой раздаче находится весь материал.

Data Scientist создаёт и обучает предиктивные модели с помощью алгоритмов машинного обучения и нейросетей, помогая бизнесу находить скрытые закономерности, прогнозировать развитие событий и оптимизировать ключевые бизнес-процессы.

Курс состоит из более чем 180 часов видео и домашних заданий от ведущих специалистов по Data Scientist компаний Mail.ru, Ivi и Avito.

Первые два набора уже удачно состоялись, и студенты вовсю погрузились в базовые алгоритмы ML, feature engineering, машинное зрение, Data Scientist в e-commerce, временные ряды и прогнозирование стоимости акций и других товаров. Их преподавателями стали эксперты из Yandex Data Factory, Rambler&Co, Сбербанк Технологии и теперь у вас появится возможность получить все необходимые знания и навыки для работы в области больших данных.

Программа обучения:

I Подготовительный блок:

Экспресс-обучение основным инструментам: Python 3, git, библиотеки numpy, pandas. Обзор основного математического аппарата: матричные операции, введение в статистику и проверку гипотез.

II Введение в data science, основные инструменты:

Что такое data science, big data, как это работает и где применяется. Эксплоративный анализ и библиотеки визуализации данных. Обзор методов машинного обучения в бибилотеке scikit-learn.

III Базовые алгоритмы и понятия машинного обучения:

Разбор основных задач и алгоритмов машинного обучения: деревья решений, метод k ближайших соседей, линейный классификатор и логистическая регрессия, кластеризация. Проверка точности модели. Проблема переобучения и борьба с ней: регуляризация, ансамблирование.

IV Feature engineering:

Проблемы качества и размерности данных. Уменьшение размерности данных. Методы декомпозиции. Cпрямляющие пространства.

V Рекомендательные системы:

Введение в рекомендательные системы. Неперсонализированные рекомендации. Персонализированные рекомендации. Развитие рекомендательных систем.

VI Распознавание изображений, машинное зрение:

Базовая теория. Обзор кейсов применения. Нейросети. Разбор реальных задач: рукописный ввод, детекция и сегментация объектов на изображении.

VII Обработка естественного языка (NLP):

Введение в обработку текста. Обзор существующих библиотек, их использование и доработка. Использование внешних ресурсов. Грязные тексты: что это такое и как с ними работать. Дистрибутивная семантика. Чатботы: разбор генерации текстов. Нейросети для NLP.

VIII Анализ временных рядов, прогнозирование:

Временные ряды, модели ARMA/ARIMA. Сложные модели прогнозирования. Эксплоративный анализ временных рядов.

IX Общение с заказчиком:

Проекты машинного обучения: как выявить требования и оценить проект. Составление отчетов по исследованиям. Мастер-класс по презентации результатов.

X Data Science в маркетинге и e-commerce:

Цели, задачи, решения и критерии успешности применения Data Science. Маркетинг Data-Driven vs интуиция. Типы данных и примеры датасетов. Методы сбора из разных источников. Подготовка и обработка данных, извлечение смысла и визуализация. Разбор атрибуции маркетинговых расходов для увеличения дохода интернет-магазина.

XI Дополнительные инструменты, среды:

Экосистема Google: BigQuery, Dataflow, Dataproc, Datalab и др. Коммерческие решения HP: Vertica, Haven, IDOL, коннекторы данных. Решения от Amazon (AWS). Хранение и обработка данных в Clickhouse.

XII Дипломная работа:

Разработка и внедрение собственного ML-решения/проекта либо разработка предложенного нами кейса.

Что вы получите в результате обучения

Достигнутые результаты

Построена полносвязная нейросеть

Создан чат-бот для поиска авиабилетов

Построен классификатор изображений

Созданы рекомендательные системы для музыкального и киносайта

Создан готовый к внедрению ml-проект

Ключевые навыки

Сбор и подготовка данных для анализа

Создание нейросетей

Генерация текстов и изображений

Создание рекомендательных систем

Выбор и реализация алгоритма под задачу

Выбор и создание фич для модели

Скрытое содержимое могут видеть только члены группы Премиум.
 
Последнее редактирование модератором:
Премиум
Регистрация
7 Июл 2019
Сообщения
2
Реакции
1
Монетки
5.5
Не посмотрел пока всё, но уже видно, что в уроках по питону нет самих ноутбуков с кодом, без них видео не имеет особого смысла, читать код со снятого на видео экрана ну просто глаза сломаешь(((
 
Сверху Снизу