Mise en oeuvre du checkpoint

vendredi 27 avril 2012
par  Philippe Dos Santos

STAGE (jusqu’à 3 mois)

La Grappe Massivement Parallèle de Calcul Scientifique (GMPCS, http://www.gmpcs.lumat.u-psud.fr/) est un calculateur à haut degré de disponibilité. Les incidents d’exploitation sont rares, mais pour des travaux très longs (> 1 semaine), il est souhaitable de faire des points de sauvegardes à intervalles réguliers. Ceux-ci, appelés "checkpoint", permettent le redémarrage des travaux à partir du dernier point de sauvegarde.

L’objectif de ce stage est d’étudier, d’intégrer et de valider le "checkpoint" dans le contexte de la GMPCS.

CONNAISSANCES

- Linux,

- script shell (bash)

LIEU DU STAGE

Bâtiment 210

Université Paris-Sud

91405 Orsay Cedex

CONTACTS

Pour plus d’informations, contacter Philippe Dos Santos et Georges Raseev


RTRA

Annonces

Stage : "Conteneurs dans un environnement HPC"

Rapport de stage de Jiaming HU :

PDF - 1.7 Mo
(mai - août 2017)

Stage : "Machines virtuelles et haute disponibilité"

Rapport de stage de Mahdi HAMMOUCHE :

PDF - 1.2 Mo
(juin - septembre 2016)

Stage : "Grappe de calcul HPC à éléments délocalisés"

Rapport de stage de Brahim BIKI :

PDF - 1.4 Mo
(mai-août 2015)

Stage : "Optimisation des ressources d’un cluster pour le calcul scientifique"

Rapport de stage de Damien Delhay :

PDF - 1.4 Mo
(mai-juillet 2014)

Stage : "Diagonalisation des matrices réelles sur GPU"

Rapport de stage de Kun SONG :

PDF - 803.4 ko
(mai - août 2013)

Stage : "Optimisation du transfert de données entre un CPU et un GPU"

Rapport de stage de Jean YAOKELI :

PDF - 915.4 ko
(mai - août 2012)