Matemàtiques per a "Big Data" [43478]
Cabaña Nigro, Alejandra (Universitat Autònoma de Barcelona. Departament de Matemàtiques)
Ruíz Cirera, Albert
Universitat Autònoma de Barcelona. Facultat de Ciències

Data: 2017-18
Resum: The aim of this course is to learn and apply various mathematical and statistical methods related to the discovery of relevant patterns in data sets. Nowadays, huge amounts of data are being generated in many fields, and the goal of this course is to learn how to extract information from such data. This process is often called learning from data. To begin with, we shall discuss two basic tools: k-nearest neighbours and linear regression. Then we shall move to other linear methods, both classical and more modern (such as lasso). Another topic well be non-linear statistical learning, mainly tree-based methods, and support vector machines. We shall also consider a setting in which we only have input variables, but no output. In particular, we present principal component analysis, K-means clustering and hierarchical clustering. We will also focus in clustering methods but with a markedly different approach, using topology based methods to extract insights from the shape of complex data sets.
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, la comunicació pública de l'obra i la creació d'obres derivades, fins i tot amb finalitats comercials, sempre i quan es reconegui l'autoria de l'obra original. Creative Commons
Llengua: Anglès
Titulació: Modelització per a la Ciència i l'Enginyeria / Modelling for Science and Engineering [4313136]
Pla d'estudis: Màster Universitari en Modelització per a la Ciència i la Enginyeria / Modelling for Science and Engineering [1293]
Document: Objecte d'aprenentatge



Anglès
4 p, 76.1 KB

El registre apareix a les col·leccions:
Materials acadèmics > Guies docents

 Registre creat el 2017-09-15, darrera modificació el 2023-01-29



   Favorit i Compartir