Budgetår
Institution
IDAExaminator
Olaf HartigSchemablock
HalvterminVT2: block 3
Huvudområden
DatateknikDatavetenskap
Informationsteknologi
Nivå
A1FTidsfördelning
6,0HPSchemalagd tid: 42 timmar
Självstudietid: 118 timmar
Innehåll
Kursen fokuserar på huvudbegrepp och huvudredskap för lagring, bearbetning och analys av Big Data som är nödvändiga för ett professionellt arbete och forskning inom dataanalys.
- Introduktion till Big Data: begrepp och verktyg
- Grundläggande principer av parallella beräkningar
- Filsystem och databaser för Big Data
- Förfrågningar för Big Data
- Resurshantering i en klustermiljö
- Parallella beräkningar för Big Data
- Maskininlärning för Big Data
Mål
Efter avslutad kurs skall den studerande på en avancerad nivå kunna:
- samla och lagra Big Data i en distribuerad datormiljö
- genomföra grundläggande förfrågningar till en databas som opererar på ett distribuerat filsystem
- redovisa grundläggande principer för parallella beräkningar
- använda MapReduce begreppet för att parallellisera vanliga databearbetningsalgoritmer
- redovisa hur vanliga maskininlärningsmodeller bör modifieras för att bearbeta Big Data
- använda redskap för maskininlärning av Big Data
Examinationsmoment
LAB1 - 3,0 HPLaborationer (U, G)
TEN1 - 3,0 HP
Skriftlig tentamen (U, 3, 4, 5)
Organisation
Kursen består av föreläsningar och laborationer. Föreläsningarna behandlar teori, begrepp och metoder. Laborationerna ger praktisk erfarenhet i hantering av big data.
Litteratur
Övrigt
- Artikelsamling 2018.
Relaterade profiler
Datadriven analys och maskinintelligens
DAMI - ISY |
Kommentarer
Logga in för att kunna läsa och skriva kommentarer. |