Evita el desastre en producción: Cómo simular el caos antes del baile final 🕺
Автор: Hablemos Con Datos
Загружено: 2026-01-23
Просмотров: 5
Описание:
🧪 Stress Testing en Data Science: Cómo inyectar errores y simular el CAOS (O usa uno de los títulos creativos de abajo)
Cuerpo de la descripción: ¿Tu modelo de Machine Learning es realmente robusto o solo funciona con datos perfectos? En el mundo real, los datos vienen sucios, incompletos y con errores "imposibles".
En este video, aprenderás a realizar un Stress Testing inyectando datos nulos, duplicados y valores extremos (outliers) en un dataset de 1 MILLÓN de registros. Dominar la calidad de datos (Data Quality) es lo que separa a un analista junior de un experto que entiende la psicología del error en los sistemas de producción.
📍 Puntos clave y Timestamps
[00:00] – Introducción al Stress Testing. Por qué es vital "ensuciar" tus propios datos para practicar.
[01:12] – Inyección de datos "imposibles". Creación de valores extremos (outliers) como edades de 250 años o ingresos negativos.
[04:54] – Simulación de valores nulos (NaN). Uso de sample y frac para inyectar un 10% de vacíos en columnas específicas.
[11:24] – Generación de duplicidad masiva. Cómo concatenar muestras para inflar el dataset y probar el rendimiento.
[15:11] – Inyección de variables categóricas. Uso de random.choices para rellenar columnas de ciudades de forma aleatoria.
[28:42] – Caos en los formatos de fecha. Cómo romper la estructura de las fechas para retar a tus algoritmos de limpieza.
[33:55] – Mezclando el Dataset (Shuffling). Reset de índices para que no sepamos dónde están los errores y sea un reto real.
[36:00] – Cálculos de "Salud del Dato". Cómo obtener el porcentaje de nulos y duplicados mediante código.
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: