Data Science пример задачи кредитного скоринга / Урок построения модели ML на python HD

Data Science пример задачи кредитного скоринга / Урок построения модели ML на python
00:24:27
Обнаружено блокирование рекламы на сайте

Для существования нашего сайта необходим показ рекламы. Просим отнестись с пониманием и добавить сайт в список исключений вашей программы для блокировки рекламы (AdBlock и другие).

12n.ru 19172 ролика

Data Science пример задачи кредитного скоринга / Урок построения модели ML на python.

Разбираем задачу по Data Science кредитный скоринг с использованием модели логистической регрессии. Учимся грамотно подходить к разведочному анализу данных EDA, а также обучать модель ML и интерпретировать результаты для бизнеса.

Авторский курс по Data Science для начинающих pymagic.ru

Датасет https://www.kaggle.com/c/sf-dst-scoring

https://github.com/miracl1e6/credit-scoring

Таймкоды:
00:00 Задача кредитного скоринга
00:25 Что необходимо сделать перед построением модели
00:44 Загрузка данных и предварительный анализ
04:07 Главная фишка EDA анализа!!! Как делать EDA?
05:29 Рассматриваем гипотезы
06:13 Анализируем целевую переменную (таргет) / Дисбаланс классов
07:11 Первая гипотеза. Распределение возраста в разрезе таргета (seaborn), нормализуем данные
08:11 Вторая гипотеза. Распределение возраста в разрезе образования / boxplot
10:10 Корреляция признаков
10:30 Третья гипотеза. Анализ зарплат в разрезе таргета / образования
12:33 Feature engineering (генерация фичей), как его делать, какие могут быть новые признаки, что делать с признаком типа дата-время, логарифмирование
15:07 Построение модели машинного обучения. 1 этап — бейзлайн (Logistic Regression)
16:46 Как интерпретировать и использовать метрики precision, recall, roc-auc
17:41 Строим roc-auc curve
18:03 Подбор параметров модели с использованием GridSearch
18:40 Сравниваем результаты на графике roc-auc / анализируем метрики
19:32 Анализ важных признаков после обучения модели
20:02 Используем для анализа важных признаков библиотеку shap / Интерпретирует результаты
22:30 Коэффициенты логистической регрессии
23:27 Сравнение важных признаков в разных классов (визуализация различий)

Instagram www.instagram.com/miracl6_
Facebook https://www.facebook.com/miracl1e6

Группы:
Telegram t.me/pymagic
Facebook https://www.facebook.com/pymagic.ru/

#DataScience #python #ityoutubersru

RSS
Linker Nick
20:12
+3
Я так понимаю, модель это Настя, но почему кредитного скоринга? wink
Nikita Yakovlev
22:19
+2
В разделе про описательные статистики говорится про проверку гипотез. На деле она осуществляется на глазок, без использования строгих процедур, вроде, например, критерия Вилкоксона и ему подобным. Вопрос — в таких задачах строгие критерии просто не нужны или так сделано исключительно в рамках этого ролика?
Виктория Хмелева
17:01
+1
а такие проекты можно использовать в резюме?)
kanye manye
19:14
+1
Миракл сменил пол и деятельность?
Данил Булкин
05:35
Настя ты такая классная!1!!!
Rais Zakirdzhanov
09:34
Кто может дать ссылку на датасет из kaggle? не получается скачать так как выдает «Это соревнование с ограниченным участием. Участвовать могут только приглашенные пользователи.
Рэм Кудусов
10:33
А вы этому в универе научились или сами?
Ahmednt
13:04
Use English language explain for foreign
Хорунжий Александр
14:34
Несите кольцо!!1 Я знал что девушки могут быть умными, но это какой-то космический уровень.
Комментарий удален

Новости

«СёрчИнформ SIEM» интегрирована с почтовым сервером RuPost Рынок DLP-систем в Центральной Азии: как законы о суверенитете данных стимулируют спрос на локальные решения «СёрчИнформ КИБ» расширил возможности «открытого контроля» для ПК на Linux «РИКИТЛАБ» представила новую модель техподдержки ИТ-инфраструктуры промышленных предприятий MWS Cloud расширяет линейку ИИ-сервисов доступом к крупнейшей опенсорсной LLM

«СёрчИнформ SIEM» интегрирована с почтовым сервером RuPost


17 часов назад
«СёрчИнформ SIEM» интегрирована с почтовым сервером RuPost
«СёрчИнформ SIEM» интегрирована с почтовым сервером RuPost
Рынок DLP-систем в Центральной Азии: как законы о суверенитете данных стимулируют спрос на локальные решения
Рынок DLP-систем в Центральной Азии: как законы о суверенитете данных стимулируют спрос на локальные решения
«СёрчИнформ КИБ» расширил возможности «открытого контроля» для ПК на Linux
«СёрчИнформ КИБ» расширил возможности «открытого контроля» для ПК на Linux
«РИКИТЛАБ» представила новую модель техподдержки ИТ-инфраструктуры промышленных предприятий
«РИКИТЛАБ» представила новую модель техподдержки ИТ-инфраструктуры промышленных предприятий
MWS Cloud расширяет линейку ИИ-сервисов доступом к крупнейшей опенсорсной LLM
MWS Cloud расширяет линейку ИИ-сервисов доступом к крупнейшей опенсорсной LLM