Semillero

Machine Learning

Domina Machine Learning con Python & R, Entrena Modelos, y Crea Servicios Basados en Ciencia de Datos

Duracion: 12 meses Cadencia: Sesiones Semanales Inicio: 18 de Enero 2026 Inversion: 1000
12 Bloques
24 Sesiones en vivo
12 Proyectos aplicados
2 sesiones en vivo + 1 proyecto aplicado por bloque.
Quieres inscribirte? Inscribete

Descripcion

El Semillero de Machine Learning está pensado para que aprendas a crear productos con datos de principio a fin: entender el problema, preparar un buen dataset, entrenar modelos, medir su desempeño con métricas claras y convertir esas predicciones en una función que realmente se use dentro de una web app. Durante el programa dominarás estadística aplicada para tomar decisiones, trabajo en notebooks con Python para análisis y preparación de datos, modelos de regresión y clasificación, comparación justa entre enfoques, segmentación de clientes, pronóstico de demanda, modelos para texto, evaluación de modelos alternativos con enfoque de negocio, una introducción práctica a deep learning y, al final, el despliegue de modelos para dejarlos en línea. El enfoque es totalmente práctico: cada bloque cierra con un proyecto y entregables listos para portafolio, con documentación, buenas prácticas y métricas como se espera en la industria.

Highlights

Machine Learning Data Science Neural Networks Deep Learning

Resultados

  • Desarrollar Habilidades de Analisis Estadistico
  • Utilizar Herramientas de Machine Learning para la Toma de Decisiones
  • Implementar Algoritmos de Optimizacion para Maximizar Rendimientos y Minimizar Incertidumbre

Temas clave

  • Python
  • R
  • Estadistica
  • Probabilidad
  • Ciencia de Datos
  • Machine Learning
  • Neural Networks
  • Deep Learning

Roadmap 2026

Plan mensual del semillero

Sesiones en vivo

  • Introduction to R and Data Analysis
  • Introduction to Data Wrangling Pipelines & Visual Reporting

Proyecto aplicado

Data Cleaning Studio

Construye una web app en R (Shiny) que permite cargar datos reales, detectar automáticamente problemas de calidad y aplicar limpiezas esenciales de forma interactiva. La app produce un reporte visual comparativo que evidencia el impacto de cada decisión de limpieza, acercando el trabajo del científico de datos al lenguaje del negocio.

Sesiones en vivo

  • Experimental Design & Effect Estimation
  • Statistical Decisioning & Risk Assessment

Proyecto aplicado

Experiment Analysis Studio – Web App en R

Diseña y construye una herramienta web interactiva para el análisis de experimentos que permite cargar datos reales y evaluar diferencias entre grupos de forma clara y reproducible. La aplicación calcula efectos observados, intervalos de confianza, p-values y métricas de impacto, y genera una recomendación final guiada, acompañada de alertas metodológicas sobre sesgos potenciales, tamaño de muestra y supuestos estadísticos. El resultado es una app que traduce estadística en decisiones accionables, similar a las herramientas que usan equipos de producto, marketing y ciencia de datos para evaluar experimentos y pruebas A/B.

Sesiones en vivo

  • Market Data Pipeline con Python
  • Financial Metrics & Report Generation

Proyecto aplicado

Financial Report Engine

Se desarrollará una aplicación web que permite al usuario ingresar uno o varios tickers y un rango de fechas para generar, en segundos, un reporte financiero integral a partir de datos reales de mercado. La aplicación descarga información desde Yahoo Finance y ejecuta un pipeline automatizado de limpieza, transformación y análisis con NumPy y pandas, produciendo métricas clave de rendimiento y riesgo, tablas y gráficas claras, un comparativo del estado de los datos antes y después del preprocesamiento, y un resumen ejecutivo con insights accionables y advertencias metodológicas, dando como resultado una herramienta sólida, profesional y lista para portafolio y análisis financiero en contextos reales.

Sesiones en vivo

  • Building Predictive Models for Continuous Targets
  • Error Analysis & Model Comparison

Proyecto aplicado

Smart Pricing Engine — Web App de Predicción y Análisis de Error

Desarrolla una web app interactiva de predicción de precios (viviendas, autos o rentas) basada en variables reales de mercado. El sistema permite ingresar características y comparar múltiples modelos supervisados: línea base, regresión regularizada (Ridge/Lasso) y árboles de decisión, evaluando su desempeño de forma transparente.

Sesiones en vivo

  • Probabilistic Classification & Confusion Analysis
  • Threshold Optimization & Imbalanced Classification

Proyecto aplicado

Fraud Detection Console (Web App)

El alumno construye una web app que clasifica transacciones como legítimas o sospechosas y funciona como una consola de monitoreo para equipos de riesgo. La app permite ajustar el umbral de decisión en tiempo real y ver cómo cambian precision, recall y F1, además de la matriz de confusión y el costo estimado de falsos positivos vs falsos negativos. Como salida, genera una lista priorizada de transacciones para revisión humana, con probabilidad de fraude, razón de alerta y un resumen operativo del rendimiento del modelo bajo el umbral elegido, imitando el flujo real de sistemas antifraude en fintech y e-commerce.

Sesiones en vivo

  • Feature engineering and Feature Selection
  • Pipelines, Cross Validation & Fair Model Comparison

Proyecto aplicado

Feature Lab — Feature Engineering & Validation Console

Desarrolla una web app para ingeniería y validación de características en datasets tabulares. La aplicación ejecuta un diagnóstico automático del conjunto de datos, genera y evalúa variables derivadas, rankea características mediante correlación, información mutua e importancia por permutación, y compara el desempeño de modelos con y sin selección de variables usando pipelines reproducibles y validación cruzada. El sistema detecta riesgos de fuga de información, presenta métricas claras y genera un reporte técnico conciso que justifica la selección final de características, alineado con prácticas profesionales de Machine Learning.

Sesiones en vivo

  • Alternative Classification Models: KNN, Naive Bayes and SVM for classification, probabilistic outputs and calibration.
  • Cost-Based Model Selection & Decision Rules

Proyecto aplicado

Risk Decision Lab — Consola de selección de modelos por costo

Desarrollar una web app para comparación avanzada de modelos de clasificación, donde distintos algoritmos (KNN, SVM y Naive Bayes) se evalúan sobre un caso real mediante validación cruzada y métricas probabilísticas. La aplicación permite definir costos explícitos de falsos positivos y falsos negativos, ajustar el umbral de decisión y analizar curvas ROC y PR. Como salida, el sistema genera una recomendación automática del modelo y umbral óptimos, junto con un reporte técnico conciso que justifica la decisión bajo un enfoque de minimización de riesgo, replicando flujos reales de selección de modelos en entornos profesionales de Machine Learning.

Sesiones en vivo

  • K-means Clustering & Cluster Selection
  • PCA for Segment Interpretation & Visualization

Proyecto aplicado

Customer Segments Dashboard — Consola de segmentación y perfiles

Desarrolla una web app de segmentación no supervisada que agrupa clientes mediante K-means sobre variables de comportamiento. La aplicación estandariza variables, evalúa el número óptimo de clusters y utiliza PCA para visualizar y describir los segmentos en espacios reducidos. Como resultado, el sistema genera perfiles claros por grupo, métricas de calidad de segmentación y sugerencias de acción por segmento, replicando flujos reales de segmentación utilizados en marketing, producto y analítica de clientes.

Sesiones en vivo

  • Temporal Patterns, Baselines & Evaluation
  • Practical Forecasting with Calendar Features

Proyecto aplicado

Demand Forecaster — Sistema de pronóstico operativo

Desarrolla un programa capaz de pronósticar demanda realiza predicciones semanales a partir de series de tiempo reales. La aplicación incorpora baselines, estacionalidad y variables de calendario, evalúa el desempeño con particiones temporales correctas y produce escenarios de demanda, alertas de semanas pico y recomendaciones simples para planeación, replicando flujos usados en retail y operaciones.

Sesiones en vivo

  • Text Classification with TF-IDF
  • Embeddings & Similarity Search

Proyecto aplicado

Support Inbox AI — Consola inteligente de tickets

Realiza una app capaz de analizar tickets de soporte, clasifica mensajes por tema y urgencia usando TF-IDF y modelos supervisados, y permite buscar tickets similares mediante embeddings. El sistema muestra métricas de desempeño, sugiere respuestas base y facilita la priorización de casos, emulando herramientas reales de automatización en soporte y customer success.

Sesiones en vivo

  • Practical Foundations of Neural Networks
  • Transfer Learning for Image Classification

Proyecto aplicado

Visual QC — Clasificación visual con modelos preentrenados

Desarrollar una web app de control de calidad visual que permite subir imágenes y clasificarlas usando transfer learning con modelos preentrenados. La aplicación muestra predicciones, métricas de clasificación y ejemplos de errores comunes, ofreciendo una demo clara y profesional del uso de visión por computadora en escenarios reales.

Sesiones en vivo

  • Packaging Models for Prediction Services
  • Deployment & Operational Basics

Proyecto aplicado

Model Deployment Kit - Bots Systems

Entregar un modelo completo desplegado en la nube usando integraciones comoo las de OpenAI además incluye aquellas herramientas desarrolladas en los bloques previos, genera una API pública de predicción, demo web mínima, validación de entradas, logging básico y documentación clara. El proyecto culmina con un flujo end-to-end funcional, demostrando capacidad real de llevar modelos de Machine Learning desde el notebook hasta producción.