Linux Cluster til Center of Excelence/Beskrivelse til CoE West

From Teknologisk videncenter
Jump to: navigation, search

Erhvervs-skolernes forlag har udarbejdet en Wiki til CoE projekter: Se CoE @ EF

High Performance Linux Clusters

float

Linux Clustere er den mest udbredte form for Supercomputere og er i hastig udvikling. Supercomputere bliver mindre og billigere og anvendes i mange flere sammenhænge. Dette skyldes blandt andet udviklingen af nye teknologier for eksempel en ny generation af programmerbare IC kredse FPGA og GPU[1].

En Supercomputer er i princippet mange computere der arbejder sammen om at løse en fælles opgave. For at programmere en supercomputer kræver det at programmørene anvender specielle programmerings tekniker.

Supercomputere har traditionelt været anvendt af offentlige institutioner og multinationale firmaer til løsning af komplekse opgaver. Nu er Supercomputere inden for rækkevidde af alle.

Danmark har i mange år været med upfront internationalt med store supercomputere, men er idag ikke repræsenteret på TOP500[2]; listen.

Dette projekt har til formål at udbrede anvendelsen af Supercomputere, således at danske virksomheder kan udvikle nye metoder og produkter til det globale marked.

Hvor anvendes supercomputere

Mindre supercomputere

Nye anvendelsesområder dukker jævnligt op. For eksempel har det danske firma Prevas [3] udviklet en ny supercomputer til diagnosticering af blodpropper og andre hjertesygdomme - uden indgreb - ved at anvende 3D visualisering af hjertet og alle blodårer på patienter i sand tid. Firmaet Vestas[4] anvender Supercomputere til vindberegninger og overvågning af vindmøller. Supercomputere anvendes af mange brancher til analyser, beregninger og visualiseringer.

Større supercomputere

Store supercomputere anvendes af blandt andet af danske universiteter og DMI. Supercomputere kræver meget stor energitilførsel til computere og køling. En meget stor del af det samlede budget går således til strøm. En beregning fra fagbladet Wired [5] viser at gennemsnitscomputeren på TOP500 listen[6] - de 500 største Supercomputere - bruger 257 KW[7] uden køling. Det svarer til cirka 500 gennemsnits parcelhuses forbrug af strøm.[8] til en Supercomputer.

Store supercomputere er oftest geografisk uafhængige af brugerne, bare båndbredden mellem brugere og Supercomputer er stor nok. Med installationen af lyslederkabler til Grønland ville en oplagt ide være at placere en Supercomputer på Grønland. Strømmen til Supercomputeren kunne tages fra vandkraftværket Buksefjorden[9] som kan levere mere strøm end der er brug for i området omkring Nuuk.

Ofte vil firmaer der kun har brug for Supercomputere periodisk, leje sig ind på en eksisterende Supercomputer.

Fremtiden og Supercomputere

Mange forventer at fremtidens Internet[10][11] består af sammenkoblede Supercomputere der holder data og afvikler programmerne for brugere der er tilkoblet Internettet. Altså ikke som i dag, hvor de fleste brugere på Internettet har deres data liggende lokalt på deres PC og kører programmerne lokalt på deres PC.

Målgruppe og fagligt indhold

Design og optimering af High Performance Clustere indebærer mange faglige displiner, og kan derfor være interessant for flere faggrupper. I dette dokument er kun nævnt IT uddannelser i erhvervs-uddannelserne, men forløbet vil være interessant for alle som ønsker viden og know-how om High Performance Cluster teknologier.

For at afgrænse emnet vil der ud fra en givet kravspecifikation og tilgængeligt udstyr/software blive opbygget et testcluster under forløbet.

Datatekniker version 8

Speciale i infrastruktur

  • Vurdering/test af forskellige Supercomputer teknologier og vælge den rette teknologi i forhold til kravspecifikationen.
  • Overordnet design af Cluster
    • High Performance netværk
    • High Performance NAS/SAN
    • Redundans og skalerbarhed
    • Overvågning
  • Indføre energibesparende foranstaltninger
    • for eksempel at ikke anvendte dele af Clusteret kan lukkes ned.

Speciale i programmering

  • Vurdering/test af forskellige programmerings paradigmer og vælge de rette platforme i forhold til kravspecifikationen.
    • Herunder sammenligning af energiforuget mellem platformene.
  • Design og dokumentation af programmerings modeller.
    • Manual som brugeren af Clusteret kan bruge til at programmere Clusteret til sit projekt.
  • Design af software til energibesparende foranstaltninger
    • for eksempel at ikke anvendte dele af Clusteret bliver lukket ned.

IT-Supporter

  • design og opbygning af nodes.
  • Udvikle og designe metode til skalering af nodes.
  • Fysisk design og opbygning.
  • Energiregnskab og køling.

Forløb

Forløbet vil indeholde en del teori og samarbejde i studiegrupper. Forløbet designes således at der indledes med indføring i den samfundsmæssige betydning for clusterteknik. Ud fra denne indføring udarbejdes en kravspecifikation for det kommende cluster i projektet. Arbejdet med kravspecifikation er centralt da der her arbejdes med de studerendes evner til at omsætte et beskrevet virksomhedsbehov til en teknisk specifikation, der skal anvendes til at opbygge en installation efter. Efter kravspecifikatione arbejdes med en række teoretiske emner inden for clusterteknologier. I løbet af forløbet omsættes den teoretiske viden til praktiske øvelser.

Målsætningen vil være at skabe et fungerende cluster svarende til den udarbejdede kravspecifikation. For at opnå dette skal forløbet være på min. 2 uger.

Henvendelse

Hvis du er interesseret i at høre mere om dette projekt, kontakt da

Referencer