Difference between revisions of "Linux Cluster til Center of Excelence/Beskrivelse til CoE West"

From Teknologisk videncenter
Jump to: navigation, search
m (Forløb)
m
 
(36 intermediate revisions by 5 users not shown)
Line 1: Line 1:
<accesscontrol>teacher</accesscontrol>
+
<div style="font-size:1.5em; background:#fbfbfb; color:red;">
{{TOCright}}
+
Erhvervs-skolernes forlag har udarbejdet en Wiki til CoE projekter: Se [http://coe.ef.dk/ CoE @ EF]
{{Template:In progress}}
+
</div>
= High Performance Linux Clusters =
 
Linux Clustere er den mest udbredte form for Supercomputere og er i hastig udvikling. Supercomputere bliver mindre og billigere og anvendes i mange flere sammenhænge. Dette skyldes blandt andet udviklingen af nye teknologier for eksempel en ny generation af programmerbare IC kredse [[FPGA]] og [[GPU]].
 
  
En Supercomputer er i princippet mange computere der arbejder sammen om at løse en fælles opgave. For at programmere en supercomputer kræver det at programmørene anvender specielle programmerings tekniker.
+
= High Performance Linux Clusters =
 +
[[Image:Linux supercomputer.png|right|float]]
 +
Linux Clustere er den mest udbredte form for Supercomputere og er i hastig udvikling. Supercomputere bliver mindre og billigere og anvendes i mange flere sammenhænge. Dette skyldes blandt andet udviklingen af nye teknologier for eksempel en ny generation af programmerbare IC kredse [[FPGA]] og [[GPU]]<ref>[http://www.nvidia.com/object/tesla_computing_solutions.html nVidia GPU]</ref>.  
  
Supercomputere har traditionelt været anvendt af offentlige institutioner og multinationale firmaer til løsning af komplekse opgaver. Nu er Supercomputere inden for rækkevidde af alle.
+
En Supercomputer er i princippet mange computere der arbejder sammen om at løse en fælles opgave. For at programmere en supercomputer kræver det at programmørene anvender specielle programmerings tekniker.  
  
Danmark har i mange år været med upfront internationalt med store supercomputere, men er idag ikke repræsenteret på TOP500<ref>[http://www.top500.org/ TOP500]</ref> listen.
+
Supercomputere har traditionelt været anvendt af offentlige institutioner og multinationale firmaer til løsning af komplekse opgaver. Nu er Supercomputere inden for rækkevidde af alle.  
  
Dette projekt har til formål at udbrede anvendelsen af Supercomputere, således at danske virksomheder kan udvikle nye metoder og produkter til det globale marked.
+
Danmark har i mange år været med upfront internationalt med store supercomputere, men er idag ikke repræsenteret TOP500<ref>[http://www.top500.org/ TOP500]</ref>; listen.  
== Hvor anvendes supercomputere ==
 
=== Mindre supercomputere === 
 
Nye anvendelsesområder dukker jævnligt op. For eksempel har det danske firma Prevas <ref>[http://www.prevas.dk Prevas]</ref> udviklet en ny supercomputer til diagnosticering af blodpropper og andre hjertesygdomme - uden indgreb - ved at anvende 3D visualisering af hjertet og alle blodårer patienter i sand tid. Firmaet Vestas<ref>[http://www.vestas.com/ Vestas]</ref> anvender Supercomputere til vindberegninger og overvågning af vindmøller. Supercomputere anvendes af mange brancher til analyser, beregninger og visualiseringer.
 
  
=== Større supercomputere ===
+
Dette projekt har til formål at udbrede anvendelsen af Supercomputere, således at danske virksomheder kan udvikle nye metoder og produkter til det globale marked.  
Store supercomputere anvendes af blandt andet af danske universiteter og DMI. Supercomputere kræver meget stor energitilførsel til computere og køling. En meget stor del af det samlede budget går således til strøm. En beregning fra fagbladet Wired <ref>[http://www.wired.com Wired]</ref> viser at gennemsnitscomputeren på listen<ref>[http://www.top500.org/ TOP500]</ref> - de 500 største Supercomputere - bruger 257 KW<ref>[http://www.wired.com/gadgetlab/2009/06/ibm-supercomputer Wired artikel om supercomputers strømforbug]</ref> uden køling. Det svarer til cirka 500 gennemsnits parcelhuses forbrug af strøm.<ref>[http://www.forsyningen.dk/index.php?ID=813&lang=da Energiforbrug i boligen]</ref> til en Supercomputer.
 
  
Store supercomputere er oftest geografisk uafhængige af brugerne, bare båndbredden mellem brugere og Supercomputer er stor nok. Med installationen af lyslederkabler til Grønland ville en oplagt ide være at placere en Supercomputer på Grønland. Strømmen til Supercomputeren kunne tages fra vandkraftværket Buksefjorden<ref>[http://climategreenland.gl/udfordringer_og_muligheder/energi_i_fokus/vandkraftvaerker/ Buksefjordsværket]</ref> som kan levere mere strøm end der er brug for i området omkring Nuuk.
+
== Hvor anvendes supercomputere  ==
 +
 
 +
=== Mindre supercomputere  ===
 +
 
 +
Nye anvendelsesområder dukker jævnligt op. For eksempel har det danske firma Prevas <ref>[http://www.prevas.dk Prevas]</ref> udviklet en ny supercomputer til diagnosticering af blodpropper og andre hjertesygdomme - uden indgreb - ved at anvende 3D visualisering af hjertet og alle blodårer på patienter i sand tid. Firmaet Vestas<ref>[http://www.vestas.com/ Vestas]</ref> anvender Supercomputere til vindberegninger og overvågning af vindmøller. Supercomputere anvendes af mange brancher til analyser, beregninger og visualiseringer.
 +
 
 +
=== Større supercomputere  ===
 +
 
 +
Store supercomputere anvendes af blandt andet af danske universiteter og DMI. Supercomputere kræver meget stor energitilførsel til computere og køling. En meget stor del af det samlede budget går således til strøm. En beregning fra fagbladet Wired <ref>[http://www.wired.com Fagbladet Wired]</ref> viser at gennemsnitscomputeren på TOP500 listen<ref>[http://www.top500.org/ TOP500]</ref> - de 500 største Supercomputere - bruger 257 KW<ref>[http://www.wired.com/gadgetlab/2009/06/ibm-supercomputer Wired artikel om supercomputers strømforbug]</ref> uden køling. Det svarer til cirka 500 gennemsnits parcelhuses forbrug af strøm.<ref>[http://www.forsyningen.dk/index.php?ID=813&lang=da Energiforbrug i boligen]</ref> til en Supercomputer.
 +
 
 +
Store supercomputere er oftest geografisk uafhængige af brugerne, bare båndbredden mellem brugere og Supercomputer er stor nok. Med installationen af lyslederkabler til Grønland ville en oplagt ide være at placere en Supercomputer på Grønland. Strømmen til Supercomputeren kunne tages fra vandkraftværket Buksefjorden<ref>[http://climategreenland.gl/udfordringer_og_muligheder/energi_i_fokus/vandkraftvaerker/ Buksefjordsværket]</ref> som kan levere mere strøm end der er brug for i området omkring Nuuk.  
  
 
Ofte vil firmaer der kun har brug for Supercomputere periodisk, leje sig ind på en eksisterende Supercomputer.
 
Ofte vil firmaer der kun har brug for Supercomputere periodisk, leje sig ind på en eksisterende Supercomputer.
  
=== Fremtiden og Supercomputere ===
+
=== Fremtiden og Supercomputere ===
Mange forventer at fremtidens Internet består af sammenkoblede Supercomputere der holder data og afvikler programmerne for brugere der er tilkoblet Internettet. Altså ikke som i dag, hvor de fleste brugere på Internettet har deres data liggende lokalt på deres PC og kører programmerne lokalt på deres PC.
 
  
= Målgruppe og fagligt indhold=
+
Mange forventer at fremtidens Internet<ref>[http://www.serverwatch.com/virtualization/article.php/3785841/Is-Virtualization-the-Future-of-Supercomputing.htm Is Virtualization the Future of Supercomputing?]</ref><ref>[http://www.gartner.com/it/page.jsp?id=707508 Gartner om Cloud Computing]</ref> består af sammenkoblede Supercomputere der holder data og afvikler programmerne for brugere der er tilkoblet Internettet. Altså ikke som i dag, hvor de fleste brugere på Internettet har deres data liggende lokalt på deres PC og kører programmerne lokalt på deres PC.
Design og optimering af High Performance Clustere indebærer mange faglige displiner, og kan derfor være interessant for flere faggrupper. I dette dokument er kun nævnt IT uddannelser i erhvervs-uddannelserne, men emnet er interessant for andre faggrupper.
+
 
 +
= Målgruppe og fagligt indhold =
 +
 
 +
Design og optimering af High Performance Clustere indebærer mange faglige displiner, og kan derfor være interessant for flere faggrupper. I dette dokument er kun nævnt IT uddannelser i erhvervs-uddannelserne, men forløbet vil være interessant for alle som ønsker viden og know-how om High Performance Cluster teknologier.  
  
 
For at afgrænse emnet vil der ud fra en givet kravspecifikation og tilgængeligt udstyr/software blive opbygget et testcluster under forløbet.  
 
For at afgrænse emnet vil der ud fra en givet kravspecifikation og tilgængeligt udstyr/software blive opbygget et testcluster under forløbet.  
 
+
 
== Datatekniker version 8 ==
+
== Datatekniker version 8 ==
=== Speciale i infrastruktur ===
+
 
*Vurdering/test af forskellige Supercomputer teknologier og vælge den rette teknologi i forhold til kravspecifikationen.
+
=== Speciale i infrastruktur ===
*Overordnet design af Cluster
+
 
**High Performance netværk
+
*Vurdering/test af forskellige Supercomputer teknologier og vælge den rette teknologi i forhold til kravspecifikationen.  
**Redundans i netværk og Cluster
+
*Overordnet design af Cluster  
**Overvågning
+
**High Performance netværk  
*Indføre energibesparende foranstaltninger
+
**High Performance [[NAS]]/[[SAN]]
 +
**Redundans og skalerbarhed
 +
**Overvågning  
 +
*Indføre energibesparende foranstaltninger  
 
**for eksempel at ikke anvendte dele af Clusteret '''kan''' lukkes ned.
 
**for eksempel at ikke anvendte dele af Clusteret '''kan''' lukkes ned.
=== Speciale i programmering ===
+
 
*Vurdering/test af forskellige programmerings paradigmer og vælge de rette platforme i forhold til kravspecifikationen.
+
=== Speciale i programmering ===
**Herunder sammenligning af energiforuget mellem platformene.
+
 
*Design og dokumentation af programmerings modeller.
+
*Vurdering/test af forskellige programmerings paradigmer og vælge de rette platforme i forhold til kravspecifikationen.  
*Design af software til energibesparende foranstaltninger
+
**Herunder sammenligning af energiforuget mellem platformene.  
 +
*Design og dokumentation af programmerings modeller.
 +
**Manual som brugeren af Clusteret kan bruge til at programmere Clusteret til sit projekt.  
 +
*Design af software til energibesparende foranstaltninger  
 
**for eksempel at ikke anvendte dele af Clusteret '''bliver''' lukket ned.
 
**for eksempel at ikke anvendte dele af Clusteret '''bliver''' lukket ned.
  
== Datatekniker version 7 ==
+
== IT-Supporter  ==
Vil kunne indgå i Datatekniker version 8 specialer, alt efter interesse og erfaring.
 
  
== IT-Supporter ==
+
*design og opbygning af nodes.  
*design og opbygning af nodes.
+
*Udvikle og designe metode til skalering af nodes.  
*Udvikle og designe metode til skalering af nodes.
+
*Fysisk design og opbygning.  
*Fysisk design og opbygning.
 
 
*Energiregnskab og køling.
 
*Energiregnskab og køling.
  
= Elevforudsætninger =
+
= Forløb  =
For at få det optimale ud af forløbet, vil det være en fordel at køre det sidst i uddannelsen.
+
 
= Forløb =
+
Forløbet vil indeholde en del teori og samarbejde i studiegrupper. Forløbet designes således at der indledes med indføring i den samfundsmæssige betydning for clusterteknik. Ud fra denne indføring udarbejdes en kravspecifikation for det kommende cluster i projektet. Arbejdet med kravspecifikation er centralt da der her arbejdes med de studerendes evner til at omsætte et beskrevet virksomhedsbehov til en teknisk specifikation, der skal anvendes til at opbygge en installation efter. Efter kravspecifikatione arbejdes med en række teoretiske emner inden for clusterteknologier. I løbet af forløbet omsættes den teoretiske viden til praktiske øvelser.
Forløbet vil indeholde en del teori og samarbejde i studiegrupper. For at nå målet - at have et kørende Cluster - i forhold til kravspecifikationen - skal forløbet være på to uger.
+
 
 +
Målsætningen vil være at skabe et fungerende cluster svarende til den udarbejdede kravspecifikation. For at opnå dette skal forløbet være på min. 2 uger.  
 +
 
 +
= Henvendelse =
 +
Hvis du er interesseret i at høre mere om dette projekt, kontakt da
 +
 
 +
*[mailto:pasa@mercantec.dk Underviser og projektleder Paul Saunders]
 +
*[mailto:rael@mercantec.dk Underviser Rasmus Elmholt]
 +
*[mailto:heth@mercantec.dk Underviser Henrik Thomsen]
  
= Succeskriterier =
+
= Referencer =
= Cleantech =
 
Herunder hvad er det excelente
 
  
=Referencer=
 
 
<references/>
 
<references/>
[[Category:Cluster]][[Category:Linux]]
+
 
 +
[[Category:Cluster]] [[Category:Linux]][[Category:CoE]]

Latest revision as of 15:33, 18 September 2012

Erhvervs-skolernes forlag har udarbejdet en Wiki til CoE projekter: Se CoE @ EF

High Performance Linux Clusters

float

Linux Clustere er den mest udbredte form for Supercomputere og er i hastig udvikling. Supercomputere bliver mindre og billigere og anvendes i mange flere sammenhænge. Dette skyldes blandt andet udviklingen af nye teknologier for eksempel en ny generation af programmerbare IC kredse FPGA og GPU[1].

En Supercomputer er i princippet mange computere der arbejder sammen om at løse en fælles opgave. For at programmere en supercomputer kræver det at programmørene anvender specielle programmerings tekniker.

Supercomputere har traditionelt været anvendt af offentlige institutioner og multinationale firmaer til løsning af komplekse opgaver. Nu er Supercomputere inden for rækkevidde af alle.

Danmark har i mange år været med upfront internationalt med store supercomputere, men er idag ikke repræsenteret på TOP500[2]; listen.

Dette projekt har til formål at udbrede anvendelsen af Supercomputere, således at danske virksomheder kan udvikle nye metoder og produkter til det globale marked.

Hvor anvendes supercomputere

Mindre supercomputere

Nye anvendelsesområder dukker jævnligt op. For eksempel har det danske firma Prevas [3] udviklet en ny supercomputer til diagnosticering af blodpropper og andre hjertesygdomme - uden indgreb - ved at anvende 3D visualisering af hjertet og alle blodårer på patienter i sand tid. Firmaet Vestas[4] anvender Supercomputere til vindberegninger og overvågning af vindmøller. Supercomputere anvendes af mange brancher til analyser, beregninger og visualiseringer.

Større supercomputere

Store supercomputere anvendes af blandt andet af danske universiteter og DMI. Supercomputere kræver meget stor energitilførsel til computere og køling. En meget stor del af det samlede budget går således til strøm. En beregning fra fagbladet Wired [5] viser at gennemsnitscomputeren på TOP500 listen[6] - de 500 største Supercomputere - bruger 257 KW[7] uden køling. Det svarer til cirka 500 gennemsnits parcelhuses forbrug af strøm.[8] til en Supercomputer.

Store supercomputere er oftest geografisk uafhængige af brugerne, bare båndbredden mellem brugere og Supercomputer er stor nok. Med installationen af lyslederkabler til Grønland ville en oplagt ide være at placere en Supercomputer på Grønland. Strømmen til Supercomputeren kunne tages fra vandkraftværket Buksefjorden[9] som kan levere mere strøm end der er brug for i området omkring Nuuk.

Ofte vil firmaer der kun har brug for Supercomputere periodisk, leje sig ind på en eksisterende Supercomputer.

Fremtiden og Supercomputere

Mange forventer at fremtidens Internet[10][11] består af sammenkoblede Supercomputere der holder data og afvikler programmerne for brugere der er tilkoblet Internettet. Altså ikke som i dag, hvor de fleste brugere på Internettet har deres data liggende lokalt på deres PC og kører programmerne lokalt på deres PC.

Målgruppe og fagligt indhold

Design og optimering af High Performance Clustere indebærer mange faglige displiner, og kan derfor være interessant for flere faggrupper. I dette dokument er kun nævnt IT uddannelser i erhvervs-uddannelserne, men forløbet vil være interessant for alle som ønsker viden og know-how om High Performance Cluster teknologier.

For at afgrænse emnet vil der ud fra en givet kravspecifikation og tilgængeligt udstyr/software blive opbygget et testcluster under forløbet.

Datatekniker version 8

Speciale i infrastruktur

  • Vurdering/test af forskellige Supercomputer teknologier og vælge den rette teknologi i forhold til kravspecifikationen.
  • Overordnet design af Cluster
    • High Performance netværk
    • High Performance NAS/SAN
    • Redundans og skalerbarhed
    • Overvågning
  • Indføre energibesparende foranstaltninger
    • for eksempel at ikke anvendte dele af Clusteret kan lukkes ned.

Speciale i programmering

  • Vurdering/test af forskellige programmerings paradigmer og vælge de rette platforme i forhold til kravspecifikationen.
    • Herunder sammenligning af energiforuget mellem platformene.
  • Design og dokumentation af programmerings modeller.
    • Manual som brugeren af Clusteret kan bruge til at programmere Clusteret til sit projekt.
  • Design af software til energibesparende foranstaltninger
    • for eksempel at ikke anvendte dele af Clusteret bliver lukket ned.

IT-Supporter

  • design og opbygning af nodes.
  • Udvikle og designe metode til skalering af nodes.
  • Fysisk design og opbygning.
  • Energiregnskab og køling.

Forløb

Forløbet vil indeholde en del teori og samarbejde i studiegrupper. Forløbet designes således at der indledes med indføring i den samfundsmæssige betydning for clusterteknik. Ud fra denne indføring udarbejdes en kravspecifikation for det kommende cluster i projektet. Arbejdet med kravspecifikation er centralt da der her arbejdes med de studerendes evner til at omsætte et beskrevet virksomhedsbehov til en teknisk specifikation, der skal anvendes til at opbygge en installation efter. Efter kravspecifikatione arbejdes med en række teoretiske emner inden for clusterteknologier. I løbet af forløbet omsættes den teoretiske viden til praktiske øvelser.

Målsætningen vil være at skabe et fungerende cluster svarende til den udarbejdede kravspecifikation. For at opnå dette skal forløbet være på min. 2 uger.

Henvendelse

Hvis du er interesseret i at høre mere om dette projekt, kontakt da

Referencer