Linux Cluster til Center of Excelence/forløb eksempel 1

From Teknologisk videncenter
Jump to: navigation, search

Mål

Delmål 1: Datateknikere programmering

At lave udvidelse til scilab således at parallel udførelse af matmatiske funktioner foregår på nVidia GPU.

Er dette realistisk

scilab er en open-source variant af det kommercielle produkt MatLab som er ret dyrt. Scilab er mange matematik studerendes foretrukne værktøj.

MatLab har et modul til parallel udførelse af matmatiske funktioner - men det koster. Det har scilab ikke endnu.

Fordelen ved at arbejde med scilab er at der er mange - virkeligt dygtige mennesker - som vil hjælpe os med at implementere funktionaliteten i scilab - måske komme og undervise os og eleverne?. Der er allerede et projekt som nogen skal/har taget op Google summer of code - oplæg på CUDA.

hvorfor Google Summer of Code

Uddrag fra Summer of Code

  • How do payments work?
    • Google will provide a stipend of 5500 USD per accepted student developer, of which 5000 USD goes to the student and 500 USD goes to the mentoring organization.


Vi kan desværre ikke nå at være med i år, men måske en ide at deltage næste år. Se tidsplan Google Summer of Code 2010 tidsplan.

Delmål 2: Datateknikere Infrastruktur og IT-Supportere i samarbejde

Bruge et klassesæt af computere - 16. stk - og installere Nvidia Geforce-9800GTX+ eller lignende i dem. (Pris pr. stk. kr. 1.361,- incl moms. ialt kr. 21.776,-.) Implementere samme løsning med 8 stk. på Windows og 8 stk på Linux og sammenligne deres performance/pris/strømforbrug/"nemhed til skalering" og til sidst bruge alle 16 på valgte løsning.


For at nå alle mål skal eleverne arbejde i grupper med netværk, storage samt parallel og seriel computing. Der skal udarbejdes et SAN løsning en GPU løsning samt en Cluster løsning - i første fase hver for sig, men til sidst kobles sammmen - og vise hestekræfter. (Hopefully)

Hvilke programmer skal vi bruge til at teste clusteret

Det vi skal lave er et Cluster og ikke applikationerne. Dem laver "kunderne" af clusteret. Vi kan sikkert ret nemt får nogle problemer at knuse fra brugerne af scilab, som vi kan dissikere og optimere til Clusteret. (Vi skal sortere og målsætte kraftigt her, vi har kun 2-3 uger)

I delmål 1 arbejdes med CPU tunge programmer. (Har ikke brug for meget storage). I delmål 2 arbejdes med storage tunge programmer. Terabyte+ data der skal behandles i det samlede Cluster.

Forslag til planlægning af gennemførelse

UGE 1

Holdet paralleliseres i for eksempel tre tråde. Der kører undervisning dagen igennem

  • Alle: Alle deltager
  • PRG: Programmerings interesserede (udvalgte?)
  • NET: Infrastruktur interesserede (udvalgte?)
  • HW: Hardware interesserede (udvalgte?)

Der skal naturligvis samarbejdes mellem trådene hvorfor der hver morgen er opsamling. er tages eventuelle beslutninger i fællesskab således vi arbejder på et fælles mål. Selvfølgelig kan trådene fx. HW og PRG holde møder i løbet af dagen for at koordinere og samordne arbejdet.

Lektion Mandag Tirsdag Onsdag Torsdag Fredag
08:00 - 08:45 Alle: Velkomst/intro Alle: Opsamling fra mandag - - -
08:45 - 09:30 Alle: Cluster introduktion I PRG: MPI (Message Passing Interface) I - - -
09:55 - 10:40 Alle: Cluster introduktion II NET: SAN/NAS teknologier I - - -
10:40 - 11:25 Alle: Opdeling i "tråde" og oplæg HW: Massiv skalering af model - - -
12:00 - 12:45 PRG: Introduktion til paralleisering PRG: MPI II - - -
12:45 - 13:30 NET: Introduktion til Cluster infrastruktur NET: SAN/NAS teknologier I - - -
13:45 - 14:30 HW: Introduktion til Cluster modeller HW: Strøm/køling - - -
14:30 - 15:15 Alle: OLC Alle: OLC - - -