La mésaventure Proxmox - Angristan
La mésaventure Proxmox

La mésaventure Proxmox

Ce billet a été écrit il y a longtemps. Il peut contenir des informations erronées.

Il y a 2 mois je vous parlais de mon nouveau serveur dédié et de sa mise en place sous Proxmox, très bonne expérience puisque c’était ma première utilisation de Proxmox.

Malheureusement, les mésaventures n’ont pas tardé à arriver 🙁

Mise à jour du noyau, reboot. Le serveur ne répond plus, obligé de hard reboot… Je vais ensuite sur l’interface web de Proxmox 3 pour redémarrer mes CT OpenVZ, mais l’interface ne répond pas… Je me connecte donc en SSH sur le dédié et je tente de les démarrer avec vzctl, et là, c’est le drame : « Container config file does not exist« .

Je flippe un bon coup, je cherche la conf, mais c’est bien ce que je pensais, il n’y en a plus… Tout le dossier /etc/pve a disparu.

Je comprends maintenant pourquoi, il est monté à part sur la machine :

La mésaventure Proxmox

Mais je ne sais toujours pas pourquoi il est parti.

Des fichiers de conf de conteneurs, ça se refait, mais toute la conf de PVE, c’est tendu. J’essaie de mettre la conf d’un autre serveur, ça marche pas, ça me prend la tête, j’abandonne. Heureusement, les fichiers des CT sont toujours là, donc je backup tout pour réinstaller Proxmox 3 ensuite. (Merci à Dorian pour le stockage 😉 )

Comme si ça pouvait être aussi simple ! Je réinstalle tout, je crée les CT, j’écrase les fichiers, et c’est la déception. Les CT démarrent bien, mais déjà, un petit df -h montre que les points de montage sont pétés, tout les CT me mettent 334Mo d’utilisés alors que ce n’est pas le cas, mais aussi la moitié des services ne marchent plus, puisque les plupart des permissions sont cassées, alors que j’ai bien pris soin de les conserve lors du backup. 😥

C’est le gros désavantage de OpenVZ : le stockage de CT se fais dans des dossiers avec les fichiers réels à l’intérieur, tandis que sous LXC ou KVM ce sont des images.

Je suis au bout, obligé de refaire tous les CT, donc quitte à perdre du temps, je décide de tout réinstaller sous Proxmox 4 (en RAID 0, lors de mon premier article j’étais en RAID 1, mais le HDD c’est vraiment lent et je doute que le RAID 1 me sauve de quoi que ce soit, surtout que j’ai migré mon site ailleurs) et de refaire tout les CT en VM qemu + KVM.

Installer Debian sur KVM prends tout de même plus de temps, faut suivre l’assistant comme sur un vrai PC, et configurer le réseau, etc, tandis que OpenVZ/LXC il y a des templates, OpenVZ restant le plus simple à mettre en place. Je suis plutôt content que KVM, il faut faire attention à l’allocation des ressources, notamment la RAM, puisque le cache dans la VM compte comme la mémoire réelle sur l’hôte, et je suis arrivé facilement à 12Go de RAM utilisé sur l’hôte là où j’étais à 3 ou 4 Go avec plus de conteneurs.

Évidemment, tout ne peut pas être rose, la VM qui contient la seedbox devient extrêmement lente dès qu’un torrent est ajouté, le I/O sature complètement :

La mésaventure Proxmox La mésaventure Proxmox

L’hôte, lui, va très bien, surtout avec le RAID 0, donc c’est bien KVM qui merde, sûrement les paramètres par défaut. Des gens me conseillent de passer à VirtIO, ce que je fais, je mets VirtIO partout, aucun changement, encore du temps perdu, je me décide donc à passer la Seedbox dans un CT LXC.

La seedbox marche très bien depuis, mais je trouve toujours LXC aussi nul, et je l’utilise vraiment parce que je n’ai pas le choix.

Bref, cette (ou ces) mésaventures m’ont couté plusieurs jours, surtout avec les backup interminables, mais j’ai retenu la leçon, je vais backup le dossier /etc/pve, désormais. Je ne quitte pas Proxmox, ça reste un bon outil, mais parfois il est un peu énervant, surtout que dans mon malheur j’ai appris que je n’étais pas le seul à avoir eu ce problème… 🙄


Dernière modification le 27 octobre 2016.
S’abonner
Notification pour
guest

25 Commentaires
Le plus récent
Le plus ancien Le plus populaire
Commentaires en ligne
Afficher tous les commentaires
synx

règle n°1 sous linux on ne met pas à jour sauf si c’est d’une extrême nécessité ! on est pas sous Windows! et quand on fait une mise à niveau noyaux on prend des précautions ! on prend le temps de lire la doc sur quoi et comment est constituer une mise à niveau. en général on vas mettre à jours que les potentiel failles de sécurité. le reste osef si on gagne 2% de vitesse franchement ! … cette mentalité Windozien de vouloir faire les mises à jours constamment c’est intolérable, on dirait que vous débarquer sous linux. de très loin c’est une mésaventure, j’appelle cela un oubli des fondamentaux linux. nous ne somme pas sous Windows je le rappel.

znibermo

Bonjour,

J’utilise Proxmox aussi depuis un certains temps et le passage a LSX a particulièrement mis a mal mon infra. J’ai du faire pas mal de manips pour maintenir le tout a flot jusqu’au jour ou je suis tombé sur un post précisant une manip assez simple mais qui change tout au niveau des ressources. Comme précisé dans le post, Lxc gère des images disque. En plus de ne plus donner un accès aux fichiers de mon containers, ça fait grimper les IO et flingue les perfos de la machine. En faisant un restore avec ce type de config on résout les deux problèmes : pct restore 100 vzdump-lxc-XXXX-XXXX_XX_XX-XX_XX_XX.tar.lzo –rootfs local:0.
Notez que local:0 est l’option qui permet d’avoir les fichiers visibles et réduit les IO car les accès se font directement par le filesystem.
La contre partie c’est que vous ne pouvez plus gérer les quotas.
j’espère que cela pourra aider d’autres personnes car personnellement je n’ai pas vraiment trouvé de bonne alternative a Proxmox.

Pif

Bonjour,

Utilisateur de Proxmox depuis la version 3.1, je déplore vraiment la malchance que tu as eu. J’ai été obligé de gérer une migration de 3.1 à 4.4, et clairement, étant en prod, j’avais pris toutes mes précautions. Et effectivement, mes VMs CTs ont simplement dû être re-indiquées à Proxmox.

Ma solution miracle (j’insiste sur le « ma »):
– Sauvegarder les différentes machines VMs/CTs sur disque distant.
– Éteindre toutes les VMs.
– Mettre à niveau
– Constater. Deux situations rencontrées: mes collègues ont touché du bois, tout s’est déroulé sans accro, leur reboot leur a permis de revoir toutes leurs machines en ligne, CTs & VMs.
– Pour ma part, j’ai eu ta situation. Et la miracle, restauration de mes fichiers de sauvegarde, Proxmox 4.4 les a restaurés en recréant son nouveau mode opératoire de gestion de disques, et aucuns soucis depuis 🙂

Je me permets de le signaler juste, que cela puisse sauver la mise à d’autres 😀

Je me permets aussi de préciser de suite que, Proxmox 5 et sur une base Debian 9, qui a énormément de modifications par rapport à son fonctionnement de base, notamment systemctl et autre. A tout ceux souhaitant faire leurs mise à niveau, SAUVEGARDEZ bien TOUT. D’autant plus si vous utilisez Ceph, des déboires sont arrivés aux migreurs intempestifs.

reves

Bonjour et merci pour cet article, je suis arrivé ici en cherchant comment remettre en état mon proxmox qui a lui aussi perdu des fichiers. Mais avec cette différence que les VM sont toujours en ligne mais on ne les voit pas sur l’interface web, vzdump ne les voit pas non plus. Par contre vzctl voit bien les VM.

KrustyHack

Ay,

Merci pour l’article, même si lors dem on passage sur Proxmox je n’ai eu aucun soucis. Je suis toutefois passé sous Xen que je trouve plus sympa et depuis ça se passe très bien.

Après je n’ai pas retesté Proxmox 4 (j’étais en 3.X). Il faudrait que je m’y mette mais en ce moment j’expérimente OpenNebula. :p

freechelmi

un peu hors sujet mais tu derais vraiment regarder docker , pour la gestion des « templates » et de mutualisation du travail d’autres contributeurs.

Thomas

Tu devrais essayer VMware, c’est encore moins pratique !
– Clavier virtuel Qwerty -> pratique pour les mots de passe sous linux
– Pas de clonage -> non ça c’est payant
– Pas de template -> déjà 700 VPS configuré à la main x)
– Installation des vmware tools nécessaires sur tous les OS
– Pas de NAT possible d’origine
– Interface html5 depuis la dernière version seulement ( oui le flash c’est bien )
– Gestion de plusieurs hôtes -> payant
– gestion des utilisateurs -> payant

Et à mon avis tu as bien un problème avec KVM, car je benchmark à 200mo/s sous LXC et on dépasse les 8Go/s sur KVM avec VirtiO. Mais si j’ai bien compris, en parcourant les articles sur proxmox, changer le contrôleur après installation c’est pas le top.

Allez un debian à réinstaller c’est le top non ? ^^

Thomas

ça me parait assez logique en soit même, car les torrents sont composés très petis fichers. J’arrive plus facilement à saturer un HDD avec un torrent qu’avec un téléchargement classique.

Thomas

Dans ce cas effectivement il doit y avoir des problèmes avec la machine. J’avais lu notamment que Proxmox n’aime pas trop les RAID SOFT visiblement.

Thomas

Bon j’avoue c’était marqué clairement pourtant : https://pve.proxmox.com/wiki/Software_RAID
Du coup je vais tester Virtualizor (KVM) et si je suis encore motivé, peut être déployer OpenNebula.
Car effectivement sur mon RAID SOFT avec Proxmox, je peux créer un disque de 100Go avec 10Go d’espace restant. Mais bon OVH continue les promo 60euros le serveur 128Go de RAM alors c’est le moment de changer !

aurel

J’utilise OpenNebula de mon côté sur un raid controlleur et c’est le top

nsalles

La solution simple aurait été : umount /etc/pve pour faire réapparaitre les fichiers qui sont toujours sur la partition root.

C138

Pas une solution miracle à tous les problèmes mais bon… Systématiquement j’installe le paquet etckeeper, ça gère automatiquement en version toute modification dans /etc (on peut choisir bzr/git/…).

szet

Hello
Tu as toujours ton server soyoustart ? Je songe à prendre un aussi, mais j’hésite ..

szet

Merci pour ta réponse et désolé pour la faute =), je viens de m’en rendre compte.

szet

Merci c’est sympas =)