Bonjour
J'ai un problème avec une application sous linux red hat entreprise 4.5 (noyau 2.6.9) : au bout de 24 jours de fonctionnement, celle-ci tombe systématiquement en panne pour une raison indéterminée.
Bien sûr j'ai immédiatement soupçonné l'application mais malgré mes multiples recherches je ne vois aucune anomalie : j'ai vérifié qu'il n'y avait pas de fuite mémoire (avec valgrind), j'ai relu le code et vérifié qu'il n'y avait pas de timer qui claquerait au bout de 24 jours...
J'ai fait plusieurs essais (en attendant donc à chaque fois 24 jours), et l'application cesse systématiquement de fonctionner au bout de cette période. Je précise qu'elle ne plante pas puisque l'appli apparait toujours en lançant la commande "ps -ef" par exemple.
Par contre je suis incapable de reproduire le pb en accéléré (par ex en changeant la date avec un script qui fait avancer de 55 minutes toutes les 5 minutes, afin de simuler en accéléré le comportement de mon application) ou en augmentant le nombre d'actions quotidiennes afin de tomber plus vite dans le problème. C'est toujours 24 jours quoiqu'il se passe.
Pour info, la machine sur laquelle tourne mon appli est déconnectée d'internet donc inutile de chercher par là...
Je tiens également à préciser que le problème n'apparait pas sous red-hat 7.2 (noyau 2.4.17)
Du coup j'en viens à soupçonner le système Linux lui-même qui viendrait embrouiller l'appli au bout de 24 jours, mais manquant d'expérience sur ce système, je ne vois pas du tout lequel...
Existe-il des timer dans le noyau susceptibles de claquer au bout de 24 jours?
Avez vous connaissance de cas similaires ou une appli tombe en panne au bout d'un certain temps sans raison apparente?
Merci d'avance pour vos réponses!
Partager