Semillero anual

Machine Learning

Domina Machine Learning con Python & R, Entrena Modelos, y Crea Servicios Basados en Ciencia de Datos

12 meses Sesiones Semanales Inicio 18 de Enero 2026 $1000 MXN

Resumen del programa

12 Bloques

24 Sesiones en vivo

12 Proyectos

2 sesiones en vivo + 1 proyecto aplicado por bloque.

$1000 MXN

$55 USD

Descripcion del programa

El Semillero de Machine Learning está pensado para que aprendas a crear productos con datos de principio a fin: entender el problema, preparar un buen dataset, entrenar modelos, medir su desempeño con métricas claras y convertir esas predicciones en una función que realmente se use dentro de una web app. Durante el programa dominarás estadística aplicada para tomar decisiones, trabajo en notebooks con Python para análisis y preparación de datos, modelos de regresión y clasificación, comparación justa entre enfoques, segmentación de clientes, pronóstico de demanda, modelos para texto, evaluación de modelos alternativos con enfoque de negocio, una introducción práctica a deep learning y, al final, el despliegue de modelos para dejarlos en línea. El enfoque es totalmente práctico: cada bloque cierra con un proyecto y entregables listos para portafolio, con documentación, buenas prácticas y métricas como se espera en la industria.

Lo que aprenderas

Machine Learning
Data Science
Neural Networks
Deep Learning

Resultados

Desarrollar Habilidades de Analisis Estadistico
Utilizar Herramientas de Machine Learning para la Toma de Decisiones
Implementar Algoritmos de Optimizacion para Maximizar Rendimientos y Minimizar Incertidumbre

Temas clave

Python
R
Estadistica
Probabilidad
Ciencia de Datos
Machine Learning
Neural Networks
Deep Learning

Plan de estudio

Ruta anual por modulos

Sesiones en vivo

Introduction to R and Data Analysis
Introduction to Data Wrangling Pipelines & Visual Reporting

Proyecto aplicado

Data Cleaning Studio

Construye una web app en R (Shiny) que permite cargar datos reales, detectar automáticamente problemas de calidad y aplicar limpiezas esenciales de forma interactiva. La app produce un reporte visual comparativo que evidencia el impacto de cada decisión de limpieza, acercando el trabajo del científico de datos al lenguaje del negocio.

Sesiones en vivo

Experimental Design & Effect Estimation
Statistical Decisioning & Risk Assessment

Proyecto aplicado

Experiment Analysis Studio – Web App en R

Diseña y construye una herramienta web interactiva para el análisis de experimentos que permite cargar datos reales y evaluar diferencias entre grupos de forma clara y reproducible. La aplicación calcula efectos observados, intervalos de confianza, p-values y métricas de impacto, y genera una recomendación final guiada, acompañada de alertas metodológicas sobre sesgos potenciales, tamaño de muestra y supuestos estadísticos. El resultado es una app que traduce estadística en decisiones accionables, similar a las herramientas que usan equipos de producto, marketing y ciencia de datos para evaluar experimentos y pruebas A/B.

Sesiones en vivo

Market Data Pipeline con Python
Financial Metrics & Report Generation

Proyecto aplicado

Financial Report Engine

Se desarrollará una aplicación web que permite al usuario ingresar uno o varios tickers y un rango de fechas para generar, en segundos, un reporte financiero integral a partir de datos reales de mercado. La aplicación descarga información desde Yahoo Finance y ejecuta un pipeline automatizado de limpieza, transformación y análisis con NumPy y pandas, produciendo métricas clave de rendimiento y riesgo, tablas y gráficas claras, un comparativo del estado de los datos antes y después del preprocesamiento, y un resumen ejecutivo con insights accionables y advertencias metodológicas, dando como resultado una herramienta sólida, profesional y lista para portafolio y análisis financiero en contextos reales.

Sesiones en vivo

Building Predictive Models for Continuous Targets
Error Analysis & Model Comparison

Proyecto aplicado

Smart Pricing Engine — Web App de Predicción y Análisis de Error

Desarrolla una web app interactiva de predicción de precios (viviendas, autos o rentas) basada en variables reales de mercado. El sistema permite ingresar características y comparar múltiples modelos supervisados: línea base, regresión regularizada (Ridge/Lasso) y árboles de decisión, evaluando su desempeño de forma transparente.

Sesiones en vivo

Probabilistic Classification & Confusion Analysis
Threshold Optimization & Imbalanced Classification

Proyecto aplicado

Fraud Detection Console (Web App)

El alumno construye una web app que clasifica transacciones como legítimas o sospechosas y funciona como una consola de monitoreo para equipos de riesgo. La app permite ajustar el umbral de decisión en tiempo real y ver cómo cambian precision, recall y F1, además de la matriz de confusión y el costo estimado de falsos positivos vs falsos negativos. Como salida, genera una lista priorizada de transacciones para revisión humana, con probabilidad de fraude, razón de alerta y un resumen operativo del rendimiento del modelo bajo el umbral elegido, imitando el flujo real de sistemas antifraude en fintech y e-commerce.

Sesiones en vivo

Feature engineering and Feature Selection
Pipelines, Cross Validation & Fair Model Comparison

Proyecto aplicado

Feature Lab — Feature Engineering & Validation Console

Desarrolla una web app para ingeniería y validación de características en datasets tabulares. La aplicación ejecuta un diagnóstico automático del conjunto de datos, genera y evalúa variables derivadas, rankea características mediante correlación, información mutua e importancia por permutación, y compara el desempeño de modelos con y sin selección de variables usando pipelines reproducibles y validación cruzada. El sistema detecta riesgos de fuga de información, presenta métricas claras y genera un reporte técnico conciso que justifica la selección final de características, alineado con prácticas profesionales de Machine Learning.

Sesiones en vivo

Alternative Classification Models: KNN, Naive Bayes and SVM for classification, probabilistic outputs and calibration.
Cost-Based Model Selection & Decision Rules

Proyecto aplicado

Risk Decision Lab — Consola de selección de modelos por costo

Desarrollar una web app para comparación avanzada de modelos de clasificación, donde distintos algoritmos (KNN, SVM y Naive Bayes) se evalúan sobre un caso real mediante validación cruzada y métricas probabilísticas. La aplicación permite definir costos explícitos de falsos positivos y falsos negativos, ajustar el umbral de decisión y analizar curvas ROC y PR. Como salida, el sistema genera una recomendación automática del modelo y umbral óptimos, junto con un reporte técnico conciso que justifica la decisión bajo un enfoque de minimización de riesgo, replicando flujos reales de selección de modelos en entornos profesionales de Machine Learning.

Sesiones en vivo

K-means Clustering & Cluster Selection
PCA for Segment Interpretation & Visualization

Proyecto aplicado

Customer Segments Dashboard — Consola de segmentación y perfiles

Desarrolla una web app de segmentación no supervisada que agrupa clientes mediante K-means sobre variables de comportamiento. La aplicación estandariza variables, evalúa el número óptimo de clusters y utiliza PCA para visualizar y describir los segmentos en espacios reducidos. Como resultado, el sistema genera perfiles claros por grupo, métricas de calidad de segmentación y sugerencias de acción por segmento, replicando flujos reales de segmentación utilizados en marketing, producto y analítica de clientes.

Sesiones en vivo

Temporal Patterns, Baselines & Evaluation
Practical Forecasting with Calendar Features

Proyecto aplicado

Demand Forecaster — Sistema de pronóstico operativo

Desarrolla un programa capaz de pronósticar demanda realiza predicciones semanales a partir de series de tiempo reales. La aplicación incorpora baselines, estacionalidad y variables de calendario, evalúa el desempeño con particiones temporales correctas y produce escenarios de demanda, alertas de semanas pico y recomendaciones simples para planeación, replicando flujos usados en retail y operaciones.

Sesiones en vivo

Text Classification with TF-IDF
Embeddings & Similarity Search

Proyecto aplicado

Support Inbox AI — Consola inteligente de tickets

Realiza una app capaz de analizar tickets de soporte, clasifica mensajes por tema y urgencia usando TF-IDF y modelos supervisados, y permite buscar tickets similares mediante embeddings. El sistema muestra métricas de desempeño, sugiere respuestas base y facilita la priorización de casos, emulando herramientas reales de automatización en soporte y customer success.

Sesiones en vivo

Practical Foundations of Neural Networks
Transfer Learning for Image Classification

Proyecto aplicado

Visual QC — Clasificación visual con modelos preentrenados

Desarrollar una web app de control de calidad visual que permite subir imágenes y clasificarlas usando transfer learning con modelos preentrenados. La aplicación muestra predicciones, métricas de clasificación y ejemplos de errores comunes, ofreciendo una demo clara y profesional del uso de visión por computadora en escenarios reales.

Sesiones en vivo

Packaging Models for Prediction Services
Deployment & Operational Basics

Proyecto aplicado

Model Deployment Kit - Bots Systems

Entregar un modelo completo desplegado en la nube usando integraciones comoo las de OpenAI además incluye aquellas herramientas desarrolladas en los bloques previos, genera una API pública de predicción, demo web mínima, validación de entradas, logging básico y documentación clara. El proyecto culmina con un flujo end-to-end funcional, demostrando capacidad real de llevar modelos de Machine Learning desde el notebook hasta producción.

Ver otros semilleros