Y-sektionens studienämnd är ansvariga för att informationen på guiden är aktuell. Om du hittar någonting som inte stämmer kan du mejla SNY.

Budgetår


Institution

IDA

Examinator

Olaf Hartig

Schemablock

Halvtermin

VT2: block 3

Huvudområden

Datateknik
Datavetenskap
Informationsteknologi

Nivå

A1X

Tidsfördelning

6,0HP
Schemalagd tid: 42 timmar
Självstudietid: 118 timmar

Innehåll

Kursen fokuserar på huvudbegrepp och huvudredskap för lagring, bearbetning och analys av Big Data som är nödvändiga för ett professionellt arbete och forskning inom dataanalys. 

- Introduktion till Big Data: begrepp och verktyg
- Grundläggande principer av parallella beräkningar
- Filsystem och databaser för Big Data
- Förfrågningar för Big Data
- Resurshantering i en klustermiljö
- Parallella beräkningar för Big Data
- Maskininlärning för Big Data

Mål

Efter avslutad kurs skall den studerande på en avancerad nivå kunna:
- samla och lagra Big Data i en distribuerad datormiljö
- genomföra grundläggande förfrågningar till en databas som opererar på ett distribuerat filsystem
- redovisa grundläggande principer för parallella beräkningar
- använda MapReduce begreppet för att parallellisera vanliga databearbetningsalgoritmer
- redovisa hur vanliga maskininlärningsmodeller bör modifieras för att bearbeta Big Data
- använda redskap för maskininlärning av Big Data

Examinationsmoment

LAB1 - 3,0 HP
Laborationer (U, G)
TEN1 - 3,0 HP
Skriftlig tentamen (U, 3, 4, 5)

Organisation

Kursen består av föreläsningar och laborationer. Föreläsningarna behandlar teori, begrepp och metoder.  Laborationerna ger praktisk erfarenhet i hantering av big data.
 

Litteratur

Övrigt

  • Artikelsamling 2018.

Relaterade profiler

Datadriven analys och maskinintelligens
DAMI - ISY

Kommentarer

Logga in för att kunna läsa och skriva kommentarer.