ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Curso ML 2026 #4 | carga, exploración y preparación de datos

Автор: Pildoras de programación

Загружено: 2026-02-03

Просмотров: 1155

Описание: En este live vamos a trabajar el flujo completo de un proyecto de Machine Learning, desde la ejecución del código hasta la exploración y comprensión de los datos, usando Python, Jupyter Notebooks y Google Colab.

Comenzaremos configurando el entorno de trabajo en Google Colab, entendiendo qué es un runtime, cómo se ejecuta el código en la nube y cómo interactuar correctamente con celdas de texto y código. Veremos buenas prácticas al trabajar con notebooks: orden de ejecución, guardado de cambios, manejo de errores comunes y los riesgos de la interactividad.

Luego nos enfocaremos en la carga automática de datos, descargando un dataset real desde una fuente externa, descomprimiéndolo y cargándolo en un DataFrame de Pandas, explicando cada paso del proceso y por qué es importante automatizar la obtención de datos en proyectos reales.

A partir de ahí entraremos en la exploración inicial de los datos (EDA): estructura del dataset, tipos de variables, valores faltantes, atributos categóricos y numéricos, estadísticas descriptivas, y visualización mediante histogramas y gráficos geográficos. Analizaremos escalas, distribuciones sesgadas y valores truncados, entendiendo cómo estos detalles impactan un modelo de Machine Learning.

También abordaremos uno de los puntos más críticos y comúnmente ignorados: la creación correcta del conjunto de entrenamiento y prueba, revisando muestreo aleatorio, problemas de reproducibilidad, uso de identificadores estables y muestreo estratificado para evitar sesgos en la evaluación del modelo.

Finalmente exploraremos correlaciones entre variables, visualización de relaciones, limitaciones de la correlación lineal y la creación de features derivadas para mejorar la capacidad predictiva del modelo, discutiendo riesgos como la colinealidad.

Temas clave: Python, Google Colab, Jupyter Notebooks, Pandas, Machine Learning, EDA, carga de datos, visualización, train test split, muestreo estratificado, correlación, feature engineering.

Material de apoyo: Leer los siguientes temas del capitulo 2 del libro Hands-On Machine Learning with Scikit-Learn and PyTorch - Aurélien Géron

Get the Data
Running the Code Examples Using Google Colab
Saving Your Code Changes and Your Data
The Power and Danger of Interactivity
Book Code Versus Notebook Code
Download the Data
Take a Quick Look at the Data Structure
Create a Test Set
Explore and Visualize the Data to Gain Insights
Visualizing Geographical Data
Look for Correlations
Experiment with Attribute Combinations

Episodio Spotify de apoyo: EN PROCESO

🔗 Suscripciones 👉 https://www.youtube.com/cha.../UCpqqJ...
💬 Discord 👉   / discord  
📸 Instagram 👉   / pildoras_de_programacion  
🎵 TikTok 👉 https://www.tiktok.com/@pil_programac...
📘 Facebook 👉   / pilprogramacion  
📺 YouTube 👉    / @pildorasdeprogramacion  
🔔 ¡Suscríbete y activa la campanita para no perderte futuros lives!
🔴 ¡Nos vemos en el live! 🚀🐳

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Curso ML 2026 #4 | carga, exploración y preparación de datos

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Curso ML 2026 #5 | Train/Test Split explicado

Curso ML 2026 #5 | Train/Test Split explicado

Curso ML 2026 #3 | Modelado y Evaluación Matemática

Curso ML 2026 #3 | Modelado y Evaluación Matemática

Complete Deep Learning Project : Dataset to Working Model | Building a Custom Deep Learning Model

Complete Deep Learning Project : Dataset to Working Model | Building a Custom Deep Learning Model

Curso ML 2026 #1 | Introducción al Machine Learning y sus Paradigmas

Curso ML 2026 #1 | Introducción al Machine Learning y sus Paradigmas

Окна в терминале? Да, давайте сделаем • C • Live coding

Окна в терминале? Да, давайте сделаем • C • Live coding

Валерий Бабушкин — OpenClaw, Moltbook и почему деньги всё ещё в ML

Валерий Бабушкин — OpenClaw, Moltbook и почему деньги всё ещё в ML

👉 Crea Apps Profesionales en Python con Flet + Fleting (Curso Completo MVC)

👉 Crea Apps Profesionales en Python con Flet + Fleting (Curso Completo MVC)

RoadMap: пошаговый план обучения на Data Scientist в 2026 (с нуля до жирного оффера)

RoadMap: пошаговый план обучения на Data Scientist в 2026 (с нуля до жирного оффера)

F95: Роскомнадзор и MAX | Microsoft зло | Начальники | Huawei | PLD | Курсовые работы

F95: Роскомнадзор и MAX | Microsoft зло | Начальники | Huawei | PLD | Курсовые работы

Декораторы Python — наглядное объяснение

Декораторы Python — наглядное объяснение

Curso Python 2026 #5 | list comprehensions, slices, tuplas y buenas prácticas

Curso Python 2026 #5 | list comprehensions, slices, tuplas y buenas prácticas

Roadmap Вайбкодера 2026 - с Нуля до Релиза

Roadmap Вайбкодера 2026 - с Нуля до Релиза

Новая геополитика: Куба, Россия, Китай и будущее мира | Михаил Хазин & Стив Дудник

Новая геополитика: Куба, Россия, Китай и будущее мира | Михаил Хазин & Стив Дудник

Евгений Чебатков - стендап-концерт «Человек-слепень»

Евгений Чебатков - стендап-концерт «Человек-слепень»

GLM 5 Обзор Z.ai

GLM 5 Обзор Z.ai

Swiss tables в Go. Наиболее полный разбор внутреннего устройства новой мапы

Swiss tables в Go. Наиболее полный разбор внутреннего устройства новой мапы

Мастер и Маргарита: Каков Иисус у Булгакова?

Мастер и Маргарита: Каков Иисус у Булгакова?

99,9% — легко, 100% — сложно.

99,9% — легко, 100% — сложно.

Curso Databricks 2026 #4 |  Delta Lake, Transaction Log y ACID

Curso Databricks 2026 #4 | Delta Lake, Transaction Log y ACID

Curso Databricks 2026 #5 |  Delta Lake Table

Curso Databricks 2026 #5 | Delta Lake Table

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]