Cluster di calcolo Parallelo

Responsible: 

Il cuore del sistema di calcolo è il cluster ZEUS. Un’architettura multicomputer in configurazione Beowul che può essere utilizzata per eseguire calcoli paralleli. E’ composto da un nodo server e da 11 client connessi tra loro utilizzando connessioni Ethernet. Il sistema operativo è Red Hat Enterprise 5 e vengono utilizzate le librerie di Message Parsing Interface (MPI) per l’esecuzione di codici paralleli. Al nodo server, che fornisce ogni tipo di risorsa ai nodi client, è demandato il controllo completo di tutto il cluster. Ad esso è demandato anche il ruolo di console di sistema e di punto di collegamento (gateway) con il mondo circostante. La gestione dei job viene affidata al resource manager TORQUE che implementa tutte le funzioni necessarie alla manipolazione ed esecuzione di job in un sistema batch, comprese le utilità per reperire informazioni sullo stato del sistema e quelle relative all’esecuzione dei job stessi. Affinché il resource manager abbia pieno accesso alle risorse del sistema che amministra, è abbastanza evidente che il suo programma debba in qualche modo essere “distribuito” nel sistema stesso. TORQUE è costantemente in esecuzione come demone su tutti i nodi di calcolo e sul nodo central manager del sistema.

funzionamento: 
continuo