Skip to content

Malanche/fc-aead2020

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 

Repository files navigation

Aprendizaje estadístico y análisis de datos

Ésta es la pequeña descripción del curso que se impartirá en el semestre 2020-2, en la H. Facultad de Ciencias.

Temario

Va a estar dividido todo en 3 bloques.

Bloque 1: Repaso de programación

  1. Un poco de historia e información de lenguajes de programación
  2. Python como lenguaje para prototipos
  3. Programación intermedia/avanzada en Python
    • Lambdas
    • Clases
    • Sintaxis avanzada del lenguaje

Pausa teórica

  1. Repaso de estadística básica
    • Estadística descriptiva e inferencial
    • Métricas descriptivas (media, promedio, varianza y momentos de orden superior)
    • Estimadores no sesgados
  2. Manejo de valores atípicos (Outliers)
  3. Representación visual de la información.

Bloque 1: Continuación

  1. Expresiones regulares
  2. Almacenamiento de información
    • Formatos no binarios: csv, xml, json
    • Base de datos Relacional: SQL
  3. Complejidad algorítmica (temporal y espacial)

Bloque 2: Regresión

  1. Problemas inversos
  2. Funciones de costo
  3. Optimización
    • Problemas Convexos
    • Descenso de Gradiente (Gradient Descent)
    • Descenso de Gradiente estocástico y por lotes (SGD y Batch-SGD)
  4. Métodos de regresión y clasificación básica
    • Regresión Lineal
    • Regresión Logística
    • Regresión de Tikhonov (regresión de arista)
    • k-Vecinos más cercanos
  5. Detalles de la regresión
    • Sobreajuste (Overfitting)
    • Sesgo contra Varianza
    • Validación Cruzada

Bloque 3: Aprendizaje estadístico (regresión y clasificación)

  1. Análisis de clusters (Aprendizaje sin supervisión)
  2. Máquinas de vectores de soporte (SVM)
    • Hiperplanos de separación
    • El truco del Kernel
  3. Redes Neuronales
    • De una capa
    • Algoritmo de propagación hacia atrás (Backpropagation algorithm)
    • Redes multicapa (Deep Learning)
    • Redes convolucionales
  4. Descomposición Matricial
  5. Árboles de decisión y bosques aleatorios

Nota sobre la dificultad del curso

Si les cuesta trabajo predecir el resultado de la siguiente instrucción

l = ['data'+str(s)+'.txt' for s in range(0,5)]

es muy posible que el curso les sea complicado. No nos vamos a detener mucho en cosas sobre el lenguaje, pues no vamos a estudiar Python, es un curso teórico que se auxilia de un lenguaje de programación para poner en práctica lo aprendido. Se requiere experiencia intermedia/avanzada en lenguajes de programación imperativos (C++, Python, R, java)

Método de Calificación

Se evaluará con un único examen final. Además del examen final, hay tareas durante el semestre (entre 4 y 6) que pueden sumar hasta 1.5 sobre el promedio final, pero la condición para recibir ese beneficio es pasar el final. Es decir, teniendo el 1.5 de las tareas y sacando 5.99 en el final, no se acredita el curso.

La calificación se redondea si es aprobatoria y su parte fraccionaria es mayor o igual a 1/2.

Material de consulta

Durante el curso se va a ir actualizando esta lista, y habrá notas en PDF por cada semana de curso.

About

Curso de aprendizaje estadístico 2020

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published