Creare un cluster con Proxmox 6.3
Col l’Hypervisor Proxmox è possibile implementare il cluster dei server host in maniera molto semplice e veloce.
E’ consigliato che i vari nodi abbiano installata la stessa versione.
Mettiamo il caso abbiamo tre host che devono diventare i tre nodi del cluster.
- pc1 – 192.168.1.10
- pc2 – 192.168.1.11
- pc3 – 192.168.1.12
Possiamo partire da tre host puliti oppure se abbiamo già delle macchine virtuali vediamo di far si che girino tutte sull’host principale da cui andremo a creare il cluster.
Se ci sono altre macchine virtuali su altri host conviene farne un backup su uno storage esterno e poi importarlo una volta finito tutto.
Entriamo in shell sul pc1 e diamo il comando per creare la struttura cluster:
1 |
pvecm create <CLUSTER_NAME> |
Attenzione a scegliere e scrivere correttamente il nome del cluster perchè non si potrà cambiare.
E’ possibile verificare l’esisto delle operazioni controllando lo stato del cluster:
1 |
pvecm status |
Per avere la lista dei nodi:
1 |
pvecm nodes |
Per aggiungere il secondo nodo si apre la shell sul nodo da aggiungere (pc2):
1 |
pvecm add <HOSTNAME_O_IP_DEL_PC1> |
Stessa cosa poi sul il pc3.
Ora è possibile accedere all’interfaccia di gestione di qualsiasi nodo per poter gestire il custer.
L’attuale soluzione non gestisce il failover è solo una gestione centralizzata dei vari nodi con la possibilità di migrare le macchine da un host all’altro.
Per rimuovere un nodo (la rimozione è definitiva) occorre innanzitutto migrare eventuali macchine virtuali sugli altri nodi e spegnere l’host da rimuovere.
L’host non va poi più riacceso o per lo meno non va riacceso connesso alla rete se no potrebbe corrompersi poi la struttura cluster.
Una volta spento l’host, basta collegarsi in shell su uno qualsiasi degli altri nodi ed eseguire:
1 |
pvecm delnode <HOSTNAME_O_IP_NODO> |
Nel caso si ottenesse l’errore ‘cluster not ready – no quorum?‘ provare a reimpostare il quorum impostando il numero di nodi:
1 |
pvecm expected <nodi-attivi> |
Dopo provare di nuovo ad eliminare il nodo.
Possibili problemi
- Se dopo aver aggiunto un nodo questo risulta offline
- eseguire il comando
1pvecm status - Se ci sono errori tipo “Cannot initialize CMAP service” provare con
1journalctl -b -u corosync - Potrebbe essere un problema di risoluzione host, basta aggiungere gli ip/host in /etc/hosts
- eseguire il comando
- Se dalla console principale si ha un errore di “Connection timeout” con un nuovo nodo potrebbe non aver preso i certificati
- Dal nodo che risponde male eseguire
12pvecm updatecertsreboot
- Dal nodo che risponde male eseguire
- Se dopo un installazione viene vista/montata solo la partizione /dev/pve/root e non la /dev/pve/data
- Verificare intanto che la partizione esista
1lsblk - Se si tratta di un volume LVM-Thin editare /etc/pve/storage.cfg e aggiungere
12345lvmthin: local-lvmthinpool datavgname pvecontent rootdir,imagesnodes pve,pve3,pve2 (solo se serve limitare a certi nodi)
- Verificare intanto che la partizione esista
- In caso di errore Unable to set expected votes: CS_ERR_INVALID_PARAM
- Impostare il quorum
1pvecm expected <nodi-attivi>
- Impostare il quorum