Cluster e sventure

Ieri Sabato 27 Gennaio 2007 alle ore 08:30 arrivo in ufficio e apprendo che l’intervento durante la notte per ripristinare dei problemi a un server in cluster erano andati bene e tutto era rimasto perfettamente funzionante.
Pochi istanti dopo scopro che il server web con piattaforma Windows non era più raggiungibile. A quel punto decido di andare in sala server, attacco il monitor e scopro che la macchina si è praticamente congelata. Temo subito il peggio, provo a riavviarla una dozzina di volte ma nulla da fare. Sembra essersi guastata realmente. Porto il ferro in laboratorio, lo apro e scopro che la MB non alimenta più i vari componenti tra cui il BIOS.
Chiamo il collega En3pY che non tarda ad arrivare.
Appena arrivato prendiamo i dischi dalla macchina, scendiamo in sala server, prendiamo la nostra macchina exchange, la smontiamo e iniziamo la replica su VMWare ESX i 3.5. Mentre aspettiamo la replica predisponiamo la sala macchine per poter interfacciare VM con il mondo. In sostanza anticipiamo dei lavori che erano schedulati per metà settimana prossima e li facciamo a caldo senza interrompere i servizi. Riconfiguriamo a caldo le reti sempre senza disservizi e alla sera alle 19:00 ci troviamo con exchange replicato e la farm ricostruita per il 30%. Andiamo a mangiare qualche cosa mentre il server virtuale di exchange si avvia e appena torniamo è comparsa la gina per il logon. A questo punto prendiamo la macchina exchange fisica e travasiamo i 100GB di dati sulla SAN in cira 25 minuti.Ci rispostiamo sull’exchange virtuale, montiamo la LUN a caldo tramite Win2k3 avviamo il servizio di gestione della posta di exchange… TUTTO FUNZIONA… Riavviamo per srupolo la macchina virtuale, facciamo dei test e tutto è collaudato e ok.
Ora tocca al server WEB da cui eravamo partiti. Inseriamo i dischi del server bruciato nel ferro di Exchange accendiamo e… 1 Logical drive fonund. In 10 minuti la macchina web è tornata attiva. La inseriamo nel nuovo armadio montato e cablato in giornata e alle 00:35 i servizi sono tornati tutti ONLINE.

disk

Batteria Fallata

Batteria e Multimetro

Notate nulla di strano nella foto accanto?

Se non capite di cosa sto parlando ve lo spiego io.
Seguite i due cavi rossi, quelli che arrivano dal multimetro e dall’apparato che è semplicemente una cassa audio autoamplificata. Visto che la vecchia batteria non funzionava più ho pensato di installarne una nuova. Dopo aver preso la batteria faccio per collegarla, attacco il GND e poi attacco il polo positivo. Nero con Nero e Rosso con Rosso. Appena tento di attaccare il polo Rosso sento il filo incollarsi al polo della batteria come se andasse in corto. Stacco immediatamente e tocco il diodo zener di sicurezza sullo stampato. E’ a dir poco ustionante. Controllo che vada ancora con il multimetro e poi provo a controllare la polarità della batteria.
Ecco risolto l’arcano. Il polo contrassegnato con il “+” e il colore Rosso corrisponde a GND e il “-” con il colore Nero corrisponde ai +12V.

E’ la prima volta che mi capita questa cosa e spero sia ache l’ultima!

Personalizzazione Rack

Che strano odore di vernice che si sente oggi per le scale dell’ufficio… Umm sta a vedere che questa volta non è colpa del carrozziere!
La colpa è nostra, mia e di En3pY che abbiamo deciso di iniziare a cambiare l’immagine del data center. Poco tempo fa sono arrivati due nuovi armadi rack APT NetShelter tutti neri e di buona fattura. Sono splendidi a livello meccanico ma nel Nostro Data Center non volevano dire nulla visto che sono così comuni e allora… Qualche ora di lavoro, un po’ di dime fatte in casa con cura e amore, del riposizionabile e della vernice grigia ed ecco! Ecco le porte dell’armadio personalizzate.
Meglio spiegare immediatamente che volendo inserire nella farm solo 15 armadi abbiamo deciso di usare un sistema di numerazione esadecimale. Gli armadi sranno tutti numerati da “00” a “0F”

armadi