Economía - Matemáticas y Estadística Plan 2019 (Plan a extinguir)
Grado y Doble Grado. Curso 2026/2027.
DATOS MASIVOS: BIG-DATA - 901992
Curso Académico 2026-27
Datos Generales
- Plan de estudios: DT30 - DOBLE GRADO ECONOMÍA - MATEMÁTICAS Y ESTADÍSTICA (2019) (2019-20)
- Carácter: Optativa
- ECTS: 6.0
SINOPSIS
COMPETENCIAS
Generales
Utilizar los conocimientos matemáticos para modelar y resolver problemas complejos mediante algoritmos.
Valorar diferentes soluciones alternativas y elegir de acuerdo a las situaciones específicas entre las herramientas y las técnicas adecuadas para llevar a cabo la implementación de dichas soluciones.
Saber abstraer en un problema complejo las propiedades y características esenciales, reconociendo su rango de aplicabilidad y limitaciones.
Valorar diferentes soluciones alternativas y elegir de acuerdo a las situaciones específicas entre las herramientas y las técnicas adecuadas para llevar a cabo la implementación de dichas soluciones.
Saber abstraer en un problema complejo las propiedades y características esenciales, reconociendo su rango de aplicabilidad y limitaciones.
Transversales
Tener la capacidad de reunir e interpretar datos relevantes para emitir juicios racionales que incluyan una reflexión profunda sobre temas y problemas a resolver.
Demostrar razonamiento crítico y gestionar información científica y técnica de calidad, bibliografía, bases de datos especializadas y recursos accesibles a través de Internet.
Trabajar con la línea de comandos y comprender el paradigma cliente/servidor.
Demostrar razonamiento crítico y gestionar información científica y técnica de calidad, bibliografía, bases de datos especializadas y recursos accesibles a través de Internet.
Trabajar con la línea de comandos y comprender el paradigma cliente/servidor.
Específicas
Conocer los problemas que se presentan en el manejo de grandes cantidades de datos. (CG1, CG4, CE1)
Conocer las características de los sistemas distribuidos de ficheros. (CG4, CE3)
Conocer técnicas y software de programación paralela para sistemas distribuidos de ficheros. (CG4 CE4)
Conocer las características de los sistemas distribuidos de ficheros. (CG4, CE3)
Conocer técnicas y software de programación paralela para sistemas distribuidos de ficheros. (CG4 CE4)
ACTIVIDADES DOCENTES
Clases teóricas
En las que el profesor presenta los conceptos y técnicas relevantes de los contenidos y muestra las referencias bibliográficas o enlaces web a seguir para profundizar en dichos temas.
Clases prácticas
En las que el alumnado, en un trabajo guiado por el profesor, diseña y busca soluciones a ejercicios propuestos.
Trabajos de campo
En las que el alumnado, de forma individual o por grupos, selecciona un caso de uso que requiera el tratamiento de datos masivos, lo resuelve utilizando las técnicas y tecnologías vistas durante el curso y prepara una exposición ante el profesor para presentar su solución y defenderla.
Laboratorios
En las que los alumnos implementan y depuran los programas que resuelven los problemas estudiados en las clases prácticas.
Presenciales
6
Semestre
8
Breve descriptor:
En esta asignatura se estudiará la forma de trabajar con datos de gran tamaño (Big Data) y sus problemas asociados:
- Sistemas de ficheros distribuidos, replicados y tolerantes a fallos.
- Programación paralela con el paradigma map-reduce (Spark).
- Bases de datos no relacionales (MongoDB).
- Sistemas de ficheros distribuidos, replicados y tolerantes a fallos.
- Programación paralela con el paradigma map-reduce (Spark).
- Bases de datos no relacionales (MongoDB).
Requisitos
Para seguir el curso con fluidez, se recomienda conocer:
-Principios básicos de programación en Python: bucles, listas, tipos de datos, gestión de librerías, etc.
-El funcionamiento de un ordenador personal, su sistema de ficheros y de almacenamiento.
También es recomendable conocer:
-Programación declarativa.
-Estructuras de datos
-Bases de datos relacionales.
-Principios básicos de programación en Python: bucles, listas, tipos de datos, gestión de librerías, etc.
-El funcionamiento de un ordenador personal, su sistema de ficheros y de almacenamiento.
También es recomendable conocer:
-Programación declarativa.
-Estructuras de datos
-Bases de datos relacionales.
Objetivos
Entender la necesidad del uso de datos distribuidos, replicados y tolerantes a fallos para el tratamiento masivo de datos.
Elaborar soluciones a problemas usando datos distribuidos
Elaborar soluciones a problemas usando datos distribuidos
Contenido
Introducción al big data: problemas y retos.
Sistemas distribuidos de ficheros. Arquitectura clúster, tolerancia a fallos, replicación. Manejo de sistemas distribuidos de ficheros.
Programación paralela para sistemas distribuidos de ficheros. MapReduce. Spark. Recursos web para el tratamiento masivo de datos.
Manejo de bases de datos no relacionales. Cliente/Servidor. MongoDB.
Sistemas distribuidos de ficheros. Arquitectura clúster, tolerancia a fallos, replicación. Manejo de sistemas distribuidos de ficheros.
Programación paralela para sistemas distribuidos de ficheros. MapReduce. Spark. Recursos web para el tratamiento masivo de datos.
Manejo de bases de datos no relacionales. Cliente/Servidor. MongoDB.
Evaluación
- Exámenes finales en la convocatoria ordinaria y extraordinaria: 70%
- Entrega de prácticas en las fechas indicadas: 30%
Observaciones:
1. La calificación del examen final debe ser de al menos un 5 sobre 10 para poder hacer media con el resto de las actividades evaluables y aprobar la asignatura.
2. La entrega de las prácticas es obligatoria (deben estar todas entregadas y aptas para poder aprobar la asignatura), tanto en la convocatoria ordinaria como en la extraordinaria. Se habilitará un plazo para que los alumnos puedan presentar las prácticas pendientes (no entregadas o no aptas) en la convocatoria extraordinaria.
3. Cumplidos estos requisitos, la calificación final será la media ponderada de los dos apartados indicados
- Entrega de prácticas en las fechas indicadas: 30%
Observaciones:
1. La calificación del examen final debe ser de al menos un 5 sobre 10 para poder hacer media con el resto de las actividades evaluables y aprobar la asignatura.
2. La entrega de las prácticas es obligatoria (deben estar todas entregadas y aptas para poder aprobar la asignatura), tanto en la convocatoria ordinaria como en la extraordinaria. Se habilitará un plazo para que los alumnos puedan presentar las prácticas pendientes (no entregadas o no aptas) en la convocatoria extraordinaria.
3. Cumplidos estos requisitos, la calificación final será la media ponderada de los dos apartados indicados
Bibliografía
Enlaces Web:
- Python, http://docs.python.org/3
- Apache hadoop
- Apache Spark: https://spark.apache.org/docs/latest/
- MongoDB: https://docs.mongodb.org/manual
Libros:
- Garry Turkington. Hadoop Beginner's Guide. Packt Publishing, Limited. 2013
- Hien Luu. Beginning Apache Spark 2 : with resilient distributed datasets, Spark SQL, structured streaming and Spark Machine Learning library Beginning Apache Spark 2 : with resilient distributed datasets, Spark SQL, structured streaming and Spark Machine Learning library. Springer Professional and Applied Computing eBooks 2018
- Afshin Mehrabani. MongoDB high availability. Packt Publishing, 2014.
- Python, http://docs.python.org/3
- Apache hadoop
- Apache Spark: https://spark.apache.org/docs/latest/
- MongoDB: https://docs.mongodb.org/manual
Libros:
- Garry Turkington. Hadoop Beginner's Guide. Packt Publishing, Limited. 2013
- Hien Luu. Beginning Apache Spark 2 : with resilient distributed datasets, Spark SQL, structured streaming and Spark Machine Learning library Beginning Apache Spark 2 : with resilient distributed datasets, Spark SQL, structured streaming and Spark Machine Learning library. Springer Professional and Applied Computing eBooks 2018
- Afshin Mehrabani. MongoDB high availability. Packt Publishing, 2014.
Otra información relevante
Se espera del alumnado que cuente con un portátil en las clases teóricas, así como con un correo electrónico que puedan utilizar para crear cuentas en distintas plataformas online.
Estructura
| Módulos | Materias |
|---|---|
| No existen datos de módulos o materias para esta asignatura. | |
Grupos
| Clases teóricas y/o prácticas | ||||
|---|---|---|---|---|
| Grupo | Periodos | Horarios | Aula | Profesor |
| Grupo único | 25/01/2027 - 07/05/2027 | MIÉRCOLES 16:00 - 18:00 | B16 | DANIEL LOSCOS BARROSO |
| VIERNES 16:00 - 18:00 | INF4 Aula de Informática | DANIEL LOSCOS BARROSO | ||
