Sla over en ga naar content

Virtueel evenement: Elastic Observability- Zoek de BUG

Ik hou van analogieën omdat het kan helpen dingen uit te leggen aan mensen. Ook in dit geval, voor je dagelijkse die-hard DevOps team, ontwikkelaars en andere doorgewinterde IT-personeel is een ‘bug’ een bekende term. Maar hoe vind je die BUG?

Maar wat als je ‘we hebben een bug’ zegt tegen bijvoorbeeld accountants, detailhandel, HR of ander personeel? Zij zouden waarschijnlijk denken dat het gaat om een ‘probleem’ in het platform of de applicatie waarop jij jouw bedrijf runt. Als je zou zeggen ‘hé, er zit een insect in jouw huis’, dan zouden ze waarschijnlijk denken dat er ergens een insect kruipt of vliegt. Maar jij weet toch dat een insect gemakkelijk te vinden en uit te roeien is?

Een bug in jouw bedrijfsplatform

Maar hoe doe je dat op het platform van jouw bedrijf? De plaats waar jouw organisatie de diensten voor jouw klanten creëert en levert? Diensten evolueren, platformen veranderen en waarschijnlijk zijn ook de mensen die de applicatie en diensten bouwen er niet voor altijd. Het huis blijft (min of meer) hetzelfde, maar IT-platforms en -diensten doen dat niet. Tot zover de analogie met de bug in het huis.

Diensten, software en releases volgen elkaar vrij snel op en het vastleggen van een bug kan echt tijdrovend zijn, om nog maar te zwijgen over inkomstenverlies of problemen met de klantervaring. De sleutel tot dit probleem is dus: observability. Hoe beter je bent in het vastleggen van de bug, het vinden van problemen en het kennen van de prestaties van je diensten, hoe meer het helpt om klantervaringen en innovatie te definiëren.

Leg de bug vast met de observability stack in Kibana

Tijdens dit 3 uur durende evenement hebben we gewerkt met de Elastic observability componenten zoals overview, logs, metrics, APM, uptime en alerting en hebben we geprobeerd 10 bugs te vangen. Voordat we konden beginnen met dit evenement moesten we ons aanmelden op een aangepaste Slack workspace, speciaal voor dit evenement. Deze Slack workspace werd gebruikt om je resultaat terug te communiceren naar de trainer maar belangrijker nog, het werd gebruikt om de Alerts van het systeem te ontvangen die je startpunt waren voor elke uitdaging.

Elastic zette een dummy website op waarop we de werking en prestaties van sales, services en infrastructuur konden zien. Deze dummy website werd gemonitord met behulp van Elastic APM en UpTime die draaiden in een speciale Elastic Cloud omgeving.

De ‘bugs’ werden geïntroduceerd via gescripte handgrepen. Zonder het ‘huis’ te kennen konden we de bug toch vinden met behulp van de observability componenten. Natuurlijk helpt het om het ‘huis’ te kennen, en wanneer je met de verschillende teams in je organisatie samenwerkt aan dezelfde set van (monitoring) informatie, kun je heel snel problemen identificeren en oplossen. Observatievermogen zal je niet alleen helpen om crisissen en potentieel omzet- en klantenverlies te identificeren, maar ook om andere kleinere potentieel verborgen problemen te identificeren.

Tijdens deze uitdagingen hebben we geleerd dat het opzetten van jouw monitoring de sleutel is tot het vinden en oplossen van jouw RCA. Het klinkt voor de hand liggend, maar hoe beter de monitoring data, hoe beter je observeerbaarheid kan doen en je RCA kan vinden. Om het terug te brengen naar de analogie van ‘het huis’, als je partner zegt dat er een insect in huis is, ga je waarschijnlijk elke kamer doorzoeken om het insect te vinden. Als jouw partner zegt dat het insect zich in de woonkamer bevindt, links van de bank, zal je het veel gemakkelijker en sneller vinden. Dus in feite is het niveau van de gegevens de sleutel.

Uitdaging en prijzen

Het spelelement in het virtuele evenement was dat je individueel de RCA van een issue moest vinden (getriggerd via een alert via Slack). We kregen 10 minuten per case om het antwoord te vinden. Als je het juiste antwoord had kon je 2 punten verdienen, een extra bonuspunt kon je winnen door de juiste oplossing te geven om het probleem op te lossen. Zoals een extra punt voor de snelste ronde tijdens een F1 grand prix, om analogieën te blijven gebruiken.

Voor ons beiden was het gebruik van dit soort hulpmiddelen een nieuwe ervaring. Toch slaagden we erin de RCA te vinden en zelfs enkele oplossingen voor te stellen. Na elke taak legde de trainer uit wat de juiste oplossing was en toonde ons hoe de oplossing gevonden had moeten worden. Daarna werd het systeem weer stabiel gebracht zodat een nieuw scenario kon worden geïntroduceerd.

Conclusie

Ongeveer 24 mensen deden mee aan deze “capture the bug” wedstrijd en Patrick eindigde op de 3de plaats. Hoewel de “capture the bug” workshop 3 uur duurde, voelde het nooit alsof het te lang duurde. De opzet van het webinar was goed. We keken niet alleen naar theoretische slides, maar waren ook aan het graven in de materie en voerden hands-on taken uit om een oplossing te vinden. Het spelelement maakt het echt leuk, want natuurlijk wil je je collega(‘s) verslaan. Wil je meer weten over observability in het algemeen of met behulp van Elastic, neem dan contact met ons op.