Knoten und Partitionen
Übersicht
Server in einem Cluster werden als "Nodes", also Knoten bezeichnet. Die Nodes des Linux-Clusters sind in Partitionen eingeteilt. Wenn Sie etwas auf dem Cluster berechnen lassen wollen, müssen Sie angeben, aus welcher Partition die Nodes kommen sollen. Der Name entspricht dem Releasedatum der CPUs. Folgende Partitionen stehen zur Auswahl:
Partition | Beschreibung |
---|---|
pub12 | Hochschulöffentliche Partition für alle Nutzer. Maximal 10 Tage Rechenzeit pro Auftrag. Je 2 16-Kern AMD Opteron 6276 Prozessoren aus dem Jahr 2012, 32GB-128GB Arbeitsspeicher und Infiniband-Vernetzung für Jobs mit mehreren Nodes. Da sich diese Nodes auch gleichzeitig in den Paritionen mpi und mpi1 befinden, haben Nutzer welche die Nodes über die Partitionen mpi und mpi1 nutzen Vorrang. |
pub17 | Hochschulöffentliche Partition für alle Nutzer. Maximal 6 Tage Rechenzeit pro Auftrag. Beinhaltet 8 Nodes (its-cs[132-139]) mit je 2 12-Kern Intel Xeon E5-2650 Prozessoren aus dem Jahr 2017 mit 512GB Arbeitsspeicher sowie 3 Nodes (its-cs[161-163) mit je 2 16-Kern Intel Xeon Gold 5218 Prozessoren aus dem Jahr 2019 mit 384GB Arbeitsspeicher. Alle 11 Nodes haben Infiniband-Vernetzung für Jobs mit mehreren Nodes. |
pub15 | Hochschulöffentliche Partition für alle Nutzer. Maximal 2 Tage Rechenzeit pro Auftrag. Beinhaltet insgesamt 40 Nodes aus dem Jahr 2015 mit je 2 12-Kern Intel Xeon E5-2680 Prozessoren mit 128GB Arbeitsspeicher und Infiniband-Vernetzung für Jobs mit mehreren Knoten. Da sich diese Nodes auch gleichzeitig in der Paritionen AG-Garcia befinden, haben Nutzer welche die Nodes über die Partition AG-Garcia nutzen Vorrang. |
pub15gpu | Hochschulöffentliche Partition für alle Nutzer. Maximal 2 Tage Rechenzeit pro Auftrag. Beinhaltet insgesamt 8 Nodes bei denen CPU, Arbeitsspeicher und Infiniband-Vernetzung identisch sind mit denen aus pub15. Zusätzlich Da sich diese Nodes auch gleichzeitig in der Paritionen AG-Garcia befinden, haben Nutzer welche die Nodes über die Partition AG-Garcia nutzen Vorrang. |
FB16 | Alle Mitarbeiter des Fachbereichs 16 haben Zugriff auf diese Partition. Mitarbeiter anderer Fachgebiete und Studenten mit einer Projektarbeit können ebenfalls für begrenzte Zeit freigeschaltet werden, sollte ihnen die Rechenzeit von 10 Tagen in der "public" bzw 8 Tagen in der "public2" nicht ausreichen. Ansprechpartner ist Daniel Bischof , der Ihnen bei Fragen zur Partition gerne weiterhilft. |
mpi,mpi1 | Moderierte Partitionen für MPI-Anwendungen mit vielen Nodes. Zugang auf Antrag. |
weitere Partitionen | Es gibt weitere Partitionen, die nicht öffentlich sind. Die Rechenknoten in diesen "moderierten" Partitionen wurden gewöhnlich von Fachgebieten/Fachbereichen finanziert und von diesen im Linux-Cluster betrieben. |
Informationen über Partitionen und Knoten abrufen
Das Kommando sinfo listet u.a. Informationen über Laufzeiten und Verfügbarkeiten der Partitionen des Clusters aus. Verkürzte Beispielausgabe von sinfo:
sinfo |
---|
uk00123@its-cs1:/home/users/000/uk00123> sinfo |
- In der Partition public sind 22 Knoten bereits allokiert, also in Nutzung. 12 Knoten sind im Zustand idle und stehen für Aufgaben zur Verfügung, während 22 voll belegt sind. Die maximale Laufzeit (TIMELIMIT) ist auf 10 Tage beschränkt. Der Stern nach dem Partitionsnamen bedeutet, dass es die default-Partition ist, falls für einen Job keine Partitionsangabe gemacht wird.
Es gibt auch eine grafische Variante von sinfo, welche mit sview aufgerufen werden kann. Dafür muss beim Betreten des Cluster das sogenannte "X11 forwarding" aktiviert sein (z.B. ssh -X its-cs1.its.uni-kassel.de).
Weitere Details zu Partitionen können wie folgt abgerufen werden (verkürzte Ausgabe):
scontrol show partition |
---|
uk00123@its-cs1:/home/users/000/uk00123> scontrol show partition public |
Informationen zu einzelnen Knoten abrufen
scontrol show node |
---|
uk00123@its-cs1:/home/users/000/uk00123> scontrol show node its-cs214 |