Les problèmes matériels

Problèmes matériels

Les problèmes matériels n’arrivent pas qu’aux autres …

Juste pour indiquer que je vais avoir quelques jours de pause pour les plugins, par précaution car le mien est inaccessible.

Les problèmes matériels

Et oui, ca arrive à tout le monde. Il y a une semaine, j’ai eu une remonté via Checks Nagios que mon SSD système était en erreur. Immédiatement j’en ai commandé un de secours et deux cables USB/SATA pour faire une copie clone.

En attendant la dispo pour le faire, j’ai lancé les tests SMART du disque, mais les deux étaient ok. En vérifiant la tempéréture j’ai repéré un 50° ce qui est beaucoup alors que ses copains du RAID étaient à 44 chacun.

Commandes à connaître

Alors d’ailleurs, pour tester un disque SATA, vous avez smartmontools sous Linux qui utilise les tests internes du disque.

Pour l’installer :

sudo apt-get install smartmontools

Pour lire les données SMART et lancer les tests :

sudo smartctl -i /dev/sda
sudo smartctl -t long /dev/sda
sudo smartctl -t short /dev/sda

Et donc avec le plugin Jeedom Checks Nagios il est possible d’interfacer ce check et avoir le résultat dans Jeedom et une alerte erreur.

Pour la température d’un disque c’est hddtemp :

sudo apt-get install hddtemp

Résolution

Du coup vu la température, j’ai ajouté à la commande une bombe à air pour profiter d’ouvrir mon serveur pour faire un peu de ménage. Ces petites bombes c’est génial quand meme du moment qu’on a un boitier à ventilateurs.

Ce week-end enfin un peu de temps, j’éteins le serveur (qui héberge Jeedom mais aussi Nextcloud entre autres)

Alors j’ai pas pris de photos de l’intérieur, c’était pas beau à voir. Donc nettoyage à la bombe à air, remise à propre déjà. Je relance et là le niveau sonore à largement baisser (ben oui c’est pas un NUC, mais un boitier Chenbro avec des disques hotplug car il fait tout mon stockage aussi, donc y a des ventilateurs en plus c’est un vieux AMD Fusion dessus)

Je vérifie le disque plus d’erreur sur le statut. Bon apparemment un coup de chaud ca leur fait ca des fois. Je le laisse en l’état et rempli les formulaires de retour Amazon, remet tout sous paquet prêt à partir.

Fini ? Ben non …

Hier soir on rentre, mon RSS Reader en erreur, tiens bizarre. Je vérifie du coup mon serveur, il est KO.

Reboot blocké au BIOS, je débranche le SSD et là il part (mais forcément en erreur car il n’y a plus le disque système)

Ce matin, test du disque dur sur le PC, il est en erreur, le système n’arrive pas à le démarrer. Il m’a bien.

Alors du coup, j’en ai profiter pour faire deux choses :

  • passer au NUC parceque c’est tout petit, ca consomme moins et ca améliorera les perfs ce qui est un confort appréciable vu les usages du serveur
  • passer sur une baie externe eSata USB3 pour les deux disques RAID, là ca permettra de faire du hot swap de serveur en cas de future défaillance (NUC HS, new NUC, plug fini)

Pour la réinstallation, ca se fera vite, une Debian et zou. Tout est sauvegardé sur le RAID (backup quotidien y compris de tout le MySQL)

Vivement demain et la réception du NUC pour repartir encore mieux.

11 réflexions au sujet de “Les problèmes matériels”

  1. Je suis passé sur NUC Intel (avec esxi) suite à beaucoup trop de problèmes sur une Jeedom mini/SD …

    J’en suis hyper hyper contenant …j’ai encore 2-3 points à améliorer:
    – pas réussi à faire fonctionner la puce wifi/bluetooth dans debian (surtout pour le bluetooth)
    – backup VM : je vais essayer Veeam Free ce soir …
    – backup Jeedom : pas réussi à envoyer le backup journalier interne sur un NFS provenant d’un Synology et bien monté/vu dans VMWare. J’ai du mal à faire le lien entre le disque supplémentaire et le dossier Backup … je ne veux pas tout péter maintenant que tout marche bien.

    Le Nuc me permet aussi d’héberger Sarah (sortie audio via usb), un serveur Asterisk. d’autres VM temporaires …

    Pour le backup, pour le moment, je télécharge tous les jours la sauvegarde sur mon PC (synchro OneDrive etc.) mais un jour, je l’oublierai … 🙁

    Donc au final, quand tu auras ton NUC, ce sera l’occasion de faire un petit billet là dessus 🙂 Ca devrait en intéresser pas mal.

    Répondre
    • Yep, après c’est déjà un équivalent NUC que j’ai là, juste qu’il est vieux (4 ans) 🙂 j’utilisais du container au début (LXC) mais jamais de VM, j’ai que des linux en besoin donc bon
      Mais oui je reviendrais dessus après installation car je me demande si je vais pas repasser aussi sur Yunohost au passage

      Répondre
  2. Bonsoir, penses tu que l’on peux utiliser les baies en extension disque pour les vm ? perso j’ai un nuc d34010wyk et trés content ( héberge esx6 , vm jeedom et vm zoneminder )

    Répondre
    • Aucune idée si le type de baie que j’utiliserais passerais sur esx. Il y a pas de raisons normalement, mais vu qu’il y a des configs possibles que vmware par choix bloque, je m’avancerais pas. Ca serait pas mal c’est vrai.
      Je n’utiliserais pas esx dans mon cas, c’est pas trop ma philosophie 🙂 Debian directe voir plus tard du LXC

      Répondre
  3. @François :
    Je suis preneur de ton retour sur Veeam Free, car j’avais pu constater que la version gratuite ne peut pas être utilisée avec la version gratuite (également) d’ESXi 6.0

    J’utilise également ghettoVCB pour les sauvegardes.
    J’ai mis en place cette solution en suivant les tutos de @Loic
    La procédure de restauration n’étant pas décrite, j’ai donc regardé comment faire et j’ai partagé ma petite expérience sur le forum Jeedom :
    https://www.jeedom.com/forum/viewtopic.php?f=66&t=24533

    La restauration s’est bien effectuée mais par contre, j’ai obtenu deux VM avec le même nom (une seule étant active). Je pensais que le restore écraserait les données de la VM

    Je n’ai pas eu d’avis ou conseil sur le forum

    Répondre

Laisser un commentaire