Die IT-Infrastruktur muss ganzheitlich gemonitored werden, um bei Problemen schnell reagieren zu können. Bei Dell-Servern lässt sich die Hardware sehr detailliert über die integrierte Fernwartungsschnittstelle iDrac überwachen. Im Prinzip muss man dort SNMP nur aktivieren und die Daten sprudeln drauflos.
Wie das Ganze aber im Detail funktioniert, welche Fehler man auf jeden Fall vermeiden sollte und noch vieles mehr erfährst du in diesem Beitrag. Und wie immer ist jeder einzelne Schritt mit reichlich Screenshots und ausführlichen Erklärungen belegt.
SNMP in Kombination mit iDRAC:
Bevor es an die Praxis geht, möchte ich noch schnell ein paar Punkte ansprechen. Ich setze in meinem Homelab auf Dell PowerEdge Server der Baureihen 410, 510 und 710. All diese Geräte haben eine Gemeinsamkeit. Die Rede ist von der iDRAC-Version 6. Hier ist SNMP leider noch recht rudimentär implementiert. Aufgrund des Alters meiner Hardware ist dies aber auch verständlich.
Ab der iDRAC-Version 7 ist der Funktionsumfang stark gestiegen. Dort gibt es bereits frühzeitige Benachrichtigungen über potenzielle oder tatsächliche Ausfälle. So können Serverausfälle teilweise vollständig verhindert werden oder die Recovery-Zeit nach einem Ausfall kann reduziert werden. Aber reden wir nicht mehr länger um den heißen Brei herum.
SNMP bei iDRAC aktivieren:
Die Inbetriebnahme ist hier schnell erfolgt. Hat man sich erfolgreich eingeloggt, gibt es auf der linken Seite den Menüpunkt iDRAC-Einstellungen. Nach einem Klick darauf erscheinen ganz oben auf dem Bildschirm neue Registerkarten. Nach einem Klick auf Netzwerk & Sicherheit öffnet sich ein Untermenü. Auf der rechten Seite muss man nun auf Dienste klicken.
Fast ganz unten auf der Seite gibt es den Punkt SNMP-Agent. Hier muss man zwei Dinge machen. Einmal den Haken bei Aktiviert setzen und dann noch einen SNMP Community Namen hinzufügen. Bei diesem SNMP Community String handelt es sich um ein Passwort, womit nur berechtigte Monitoringtools Zugriff auf die sensiblen Daten bekommen.
Dieser String wird von Geräten benutzt, welche die Protokolle SNMPv1 und SNMPv2c unterstützten. Ab SNMPv3 verwendet man hingegen die Benutzername/Passwort-Authentifizierung zusammen mit einer verschlüsselten Datenübertragung. Hier wird also schon deutlich mehr Wert auf Sicherheit gelegt.
SNMP, iDRAC & Checkmk kombinieren:
Nach dem Login ins Monitoringtool klickt man links oben auf den Menüpunkt Setup. Im sich nun öffnenden Fenster surft man den Punkt Hosts an. Nach einem weiteren Klick auf den Button Add host kann man auch schon mit dem Hinzufügen des Hosts beginnen. Zuerst wird dabei ein eindeutiger Name vergeben. Ich kombiniere dazu meist den Hostnamen mit der Erweiterung _Hardware.
Unter dem Punkt IPv4-Adresse wird auf die IP der iDrac selbst zurückgegriffen. Hierüber erfolgt also das Senden und Empfangen der SNMP-Daten. Da wir keinen Checkmk-Agenten und auch keine API-Integration haben, wird hier das doppelte No aus dem Drop-down-Menü ausgewählt. Wie bereits angesprochen, handelt es sich hier um die SNMP-Versionen 1 und 2. Weshalb wir diese auswählen.
Bei den SNMP-Credentials handelt es sich um einen SNMP-Community-String in den Versionen 1 und 2c. Nun wird noch das Passwort eingetragen. In meinem Demofall handelt es sich hier um das Wörtchen public. Weitere Häkchen setzen oder Angaben machen ist erstmal nicht nötig. Im Prinzip gesehen kann man direkt mit dem Speichern weiter machen und die zu überwachenden Dienste auswählen.
Tipps, Tricks & die finale Einrichtung:
Bevor ich auf den Punkt zu überwachende Services eingehe, möchte ich aber noch etwas Interessantes erwähnen. Man kann die Hardware und das Betriebssystem auch zusammen überwachen. So lässt sich beispielsweise oben der Checkmk-Agent aktivieren und unter dem Punkt Management-Board kann man dann die SNMP-Konfiguration der iDrac einstellen. Nun aber wieder zurück zum Thema.
Nach einem Klick auf den Button Save & go to connection tests kann man in Ruhe prüfen, ob ein Verbindungsaufbau stattfinden kann und das Abrufen der SNMP-Daten korrekt funktioniert. Sollte dem nicht so sein und alle Werte wurden korrekt hinterlegt, dann sollte man zu Testzwecken längere Timeout-Werte setzen. Werden sehr viele Daten auf einmal übertragen, sind bis zu 10 Sekunden sinnvoll.
Dauerhaft werden die hier hinterlegten Werte aber nicht genutzt. Dafür muss man bei Checkmk zusätzliche SNMP-Regeln anlegen und den jeweiligen SNMP-Hosts zuweisen. In Zukunft wartet die Monitoringsoftware also länger, bis eine Timout-Meldung im Dashboard sichtbar wird und die Datenabfrage unterbrochen wird.
Im nächsten Schritt wenden wir uns der Konfiguration der Dienste zu. Hier kann man festlegen, welche Dienste dauerhaft überwacht werden sollen. Weiterhin lassen sich auch die Parameter der jeweiligen Checks noch anpassen. Damit die ganze Arbeit übernommen wird, müssen oben rechts noch die ausstehenden Änderungen bestätigt werden. Das war es auch schon und die Einrichtung ist abgeschlossen.