Big Data : Mineria de dades amb el framework Apache Spark
Sànchez Gil, Daniel
Casas Roma, Jordi, dir. (Universitat Autònoma de Barcelona. Departament d'Enginyeria de la Informació i de les Comunicacions)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Additional title: Big Data : Data Mining with the framework Apache Spark
Additional title: Big Data : Minería de datos con el framework Apache Spark
Date: 2017-02-06
Abstract: El tractament i la manipulació de dades és una part inherent de la societat moderna, una disciplina que es posa en pràctica en molts àmbits quotidians. En l'actualitat, però, el volum i la tipologia de les dades (l'anomenat "Big Data") sol desbordar els mètodes de tractament i manipulació tradicionals. Cada cop més freqüentment resulta necessària la utilització d'eines de còmput distribuït i noves tècniques per afrontar l'allau de dades que origina una societat actual al segle XXI. Aquest projecte pretén estudiar la utilització d'un dels frameworks de còmput més utilitzats dins l'àmbit de Big Data, Apache Spark, en un cas d'ús real, com pot ser l'anàlisi del funcionament d'una xarxa de transport en una gran ciutat; en concret, el metro de Londres.
Abstract: Data processing and manipulation is an inherent part of modern society, a field with many everyday applications. In recent times, however, the volume and variety of data (the so-called "Big Data") is becoming a problem that traditional processing methodology is unable to cope with. The use of distributed computing and new data manipulation techniques are becoming increasingly necessary to deal with the information deluge created by 21st Century societies. This project aims to study the use of one of the better known distributed computing networks in the Big Data landscape, Apache Spark, in a real-world use case: the analysis of operation of a large, metropolitan transport network, such as the London Underground.
Abstract: El tratamiento y la manipulación de datos es una parte inherente de la sociedad moderna, una disciplina que se pone en práctica en muchos ámbitos cotidianos. En la actualidad, sin embargo, el volumen y la tipología de los datos (el llamado "Big Data") suele desbordar los métodos de tratamiento y manipulación tradicionales. Cada vez más frecuentemente resulta necesaria la utilización de herramientas de cómputo distribuido y nuevas técnicas para afrontar la avalancha de datos que origina una sociedad actual en el siglo XXI. Este proyecto pretende estudiar la utilización de uno de los frameworks de cómputo más utilizados en el ámbito de Big Data, Apache Spark, en un caso de uso real, como puede ser el análisis del funcionamiento de una red de transporte en una gran ciudad; en concreto, el metro de Londres.
Rights: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Language: Català
Studies: Grau en Enginyeria Informàtica [2502441]
Study plan: Enginyeria Informàtica [958]
Document: Treball final de grau ; Text
Subject area: Menció Tecnologies de la Informació
Subject: Dades ; Big Data ; Mineria de dades ; Aprenentatge computacional ; Còmput distribuit ; Patrons ; Xarxa ; Transport ; Metro ; Londres ; Datos ; Minería de datos ; Aprendizaje computacional ; Cómputo distribuido ; Patrones ; Red ; Transporte ; Data ; Data mining ; Machine-learning ; Distributed computing ; Patterns ; Network ; Underground ; London



12 p, 449.9 KB

The record appears in these collections:
Research literature > Bachelor's degree final project > School of Engineering. TFG

 Record created 2017-04-19, last modified 2023-07-22



   Favorit i Compartir