Hoe je een succesvolle herstelprocedure voor ICT-systemen opzet

Hoe je een succesvolle herstelprocedure voor ICT-systemen opzet

Een succesvolle herstelprocedure voor ICT-systemen

Laat ik hem Mario noemen. Ik was net begonnen in mijn eerste week als interim-manager voor een callcenter met bereikbaarheidsdiensten. Je weet wel, zo’n bedrijf dat de telefoon voor je opneemt met: “Goedemorgen Kaderbreed, waarmee kan ik u van dienst zijn?” “Nee, de heer Martens is niet aanwezig. Kan ik een boodschap aannemen?” Dat werk dus.

Ze waren net verhuisd naar een nieuwe pand en volgens mijn voorganger was alles tip top geregeld. De servers waren allemaal dubbel uitgevoerd, er was een UPS die het eerste uur stroomuitval kon overbruggen en in de kelder stond een gloednieuwe noodgenerator die binnen 5 minuten automatisch zou opstarten en het zonder onderbreking kon overnemen. Niets kon ons gebeuren.

Het was een regulier overleg waarbij een periodieke checklist voor een milieucertificering werd doorlopen. En Mario zat erbij. Er werd een vraag gesteld over de noodgenerator. Waarop Mario zich achteloos liet ontvallen: “Oh, die staat al twee weken in storing.” Toen hem gevraagd werd wanneer hij dacht dat op te lossen, en zijn reactie niet de gewenste was, was het feest compleet: nog geen kwartier later kreeg ik van diverse kanten te horen wat er gebeurd was. Tijd voor actie dus.

Plan gemaakt

Het eerste wat ik deed was natuurlijk aan Mario vragen wat er gebeurd was. Mario’s weergave strookte volledig met de beschrijving die ik van eerdere personen kreeg. Inclusief zijn reactie. “Maar waarom reageerde je dan zo?” vroeg ik. Toen kwam het: hij wilde graag een goede oplossing neerzetten en niet in twee weken iets in elkaar knutselen om vervolgens drie maanden lang bezig te zijn met het goedklooien van iets dat in de basis al slecht was. En daar kon ik het natuurlijk alleen maar mee eens zijn. Vanaf dat moment hebben Mario en ik een pact gesloten: ik ging hem helpen goede oplossingen neer te zetten en hij ging mij helpen er een mooie afdeling van te maken.

Het vervolg was simpel. Wat heb je allemaal op je bordje liggen? Wat zou wat jou betreft de volgorde daarin moeten zijn? Welke stappen en werkzaamheden moet je uitvoeren om de stroomvoorziening wel goed in te richten? En in welke volgorde zou je dat willen uitvoeren? Er volgde een keurig overzicht van activiteiten en een plan van aanpak voor de stroomvoorziening. Vervolgens heb ik de communicatie op me genomen om dat gewoon uit te voeren, inclusief de keuze voor de dingen die we niet of later gingen doen.

En toen het plaatje compleet was, sprak ik de legendarische woorden “dan hoop ik maar dat we in de tussentijd geen stroomstoring krijgen.”

Stroomstoring

Dat had ik beter niet kunnen zeggen. Want die stroomstoring kwam er natuurlijk wel. Binnen een week om precies te zijn. De UPS deed gelukkig zijn werk, maar binnen 15 minuten lag alles plat. Het bood mij uitstekende informatie over de taakverdeling bij calamiteiten. Hoe de communicatie verliep (of niet verliep) . Wat er ontbrak. En wat er allemaal verbeterd kon worden. Door alles op te schrijven ontstond er vanzelf een stappenplan voor stroomstoringen, calamiteiten, uitwijk en eigenlijk al die plannen die je nodig hebt om de continuïteit van je ICT-systemen te waarborgen. Een van de zaken waar we achter kwamen was dat we een persoon nodig had die eens in de zoveel tijd een jerrycan met diesel ging vullen bij het tankstation. Gelukkig kon de noodgenerator na 15 minuten opgestart worden en konden daarna alle systemen een voor een opgestart worden. In 45 minuten waren we weer volledig operationeel en gelukkig was de storing tijdens een rustig moment, dus waren er er weinig klanten die last hadden gehad van de storing.

Nu was het een kwestie van een evaluatie uitvoeren met alle betrokkenen, verbeterpunten verzamelen, en daar acties aan koppelen en die te belegen. Uit de evaluatie kwam naar voren dat we met 2 maanden zover konden zijn dat we een test konden uitvoeren van de noodstroomvoorziening. De noodgenerator werd gerepareerd. De werking van UPS werd doorgrond. Er bleken ook nog eens de verkeerde batterijen in te zitten, dus die werden vervangen. Er werd een procedure voor het opnieuw opstarten van het alle servers geschreven. En uiteraard werd er een stappenplan voor de test zelf geschreven.

Noodstroomtest

En toen kwam natuurlijk de grote test: zou alles werken zoals het zou moeten? Met alle operationele managers werd een tijdstip gekozen voor het uitvoeren van de test. Alle personen die aanwezig moesten zijn werden ingepland. En toen moest het gebeuren. Een monteur van de elektrische installatie zou na afstemming van het plan de knop omzetten. Het plan werd met alle betrokkenen afgestemd en er werd afgesproken hoe te communiceren via de walkie talkies. En toen gebeurde het: de monteur deed de schakelaar om. En er gebeurde… helemaal niets!!!

Nu de noodstroomvoorziening succesvol getest was, waren we gewapend tegen noodstroomstoringen. De uitwijk was nog niet geregeld. Of in ieder geval: nog niet getest. En hierbij moet je niet alleen aan servers en een uitwijklocatie denken (al dan niet met back-ups om op te starten). Een callcenter heeft namelijk niet echt loyale klanten. De vorige storing was gelukkig tijdens lunchtijd, waardoor het nauwelijks klanten had gekost. Maar als je als callcenter niet binnen 24 uur weer volledig in bedrijf bent, zijn al je klanten uitgeweken naar je concurrenten en komen ze nooit meer terug. Dan ben je dus failliet.

Voorzieningen treffen

Een succesvolle herstelprocedure voor ICT-systemen begint met het treffen van de volgende voorzieningen.

  • Je moet servers op geografisch gescheiden locaties hebben, die het al dan niet automatisch over kunnen nemen;
  • Je moet over een procedure beschikken waarmee de functionaliteit op de uitwijklocatie voor klanten transparant of uitlegbaar beschikbaar komt;
  • En je moet een testplan maken wat eens in de zoveel tijd – gecontroleerd – daadwerkelijk uitgevoerd wordt.

Maar voor dit soort acties heb je dus niet alleen de ICT-afdeling nodig. Hiervoor moeten ook alle operationele afdelingen een plan hebben liggen. Als je het risico wil afdekken van brand, neerstortende vliegtuigen en ander onheil waarmee de locatie volledig onbeschikbaar raakt moet je ook binnen de tijd die je daarvoor stelt, werkplekken hebben of kunnen regelen voor het personeel dat je nodig hebt om als bedrijf operationeel te blijven.

Uiteindelijk zijn het allemaal afwegingen van risico, schade en kosten. Wat is de maximale tijd dat ik niet bereikbaar/operationeel mag zijn? Hoeveel bedragen de kosten van de verschillende alternatieven? En wat is mij welk risico waard? Het kan natuurlijk prima dat je zegt dat het risico gewoon wilt lopen. Dat de businesscase niet positief is . Maar dan heb je die afweging in ieder geval bewust gemaakt.

Conclusie

Het opzetten van een goede herstelprocedure hoeft niet ingewikkeld te zijn. Vaak weten de mensen die in het proces zitten prima wat er allemaal moet gebeuren. Je moet alleen de tijd vrijmaken om die acties allemaal uit te voeren en de hele procedure op een veilig moment testen. Dan pas ben je verzekerd van een goede herstelprocedure.

Wil je vaker dit soort artikelen lezen? Schrijf je dan hier in en ontvang maximaal eens per twee weken een nieuw artikel in de mailbox.

Reinout Martens

Reinout Martens

Eigenaar en oprichter van Kaderbreed B.V.

Toen Reinout een jaar of 21 was – hij studeerde nog – zat hij op een feestje, waar iemand vertelde dat er een interim manager bij haar bedrijf gestart was. Een botte boer die, zonder rekening te houden met zorgvuldig opgebouwde gewoontes, relaties, werkverhoudingen, etc. overal de bijl inzette en geen rekening leek te houden met wat dat met de mensen deed. Reinouts eerste gedachte was:

“dat kan anders en ik ga dat bewijzen”.

De vijf stappen van een goede evaluatie

De vijf stappen van een goede evaluatie

De 5 stappen van een goede evaluatie

 

Wat zijn de 5 stappen van een goede evaluatie? En waarom worden die evaluaties zo weinig en met zo weinig aandacht uitgevoerd?
Waarom blijft de opvolging van de leerpunten zo vaak achterwege? Terwijl het gestructureerd uitvoeren evaluaties in mijn ervaring een fluitje van een cent is. Mits goed uitgevoerd. Met dit artikel hoop ik duidelijk te maken dat iedereen een goede evaluatie kan uitvoeren. En kan vertalen in een betere werkelijkheid. Volg de stappen en klaar is kees.

De commissie Elias

Constateerde het al in haar rapport: een van de belangrijkste oorzaken van het keer op keer mislukken van grote ICT-projecten bij de overheid, ligt in een gebrek aan lerend vermogen. En dit geldt waarschijnlijk niet alleen voor de overheid.
Toch blijkt uit promotieonderzoek van de Universiteit Twente dat ICT projecten binnen de overheid regelmatig onvoldoende geëvalueerd worden. Daardoor ontneemt men zich de kans om te verbeteren en te leren, aldus promovendus drs. Wouter Bronsgeest RI.

Een goede evaluatie bevat de volgende elementen: focus, zowel in de groep als op de juiste vraag; alle informatie op tafel; gedragen besluiten, en concreet uitvoerbare en controleerbare vervolgafspraken.

Hoe zet je zo’n evaluatie op? De vijf stappen van een goede evaluatie zijn als volgt:

(1)   voorbereiding
(2)   tijdlijn
(3)   wat ging goed/wat ging niet goed
(4)   oplossingen
(5)   vervolgafspraken

We schreven hier ook een handboek over, waar we dit tot in detail bespreken.
Dit handboek vind je hier en is gratis te downloaden!

1. De voorbereiding

Een goede voorbereiding is het halve werk. Dit begint al met de samenstelling van de aanwezigen. Nodig alleen die mensen uit die een relevante bijdrage kunnen leveren. Dit kan gaan om informatie over wat wanneer gebeurde of over de mogelijke oplossingen en de keuze daarin. En zorg ook dat iedereen die een relevante bijdrage kan leveren aanwezig is, zodat niet later nieuwe informatie tot andere inzichten kan leiden. Dus ook mensen die er last van hadden, of personen die iets moet gaan doen of regelen. Zorg dus dat je het juiste team bij elkaar krijgt.

Begin de sessie met een introductie waarom we bij elkaar zitten. Daarna moet je zo snel mogelijk iedereen bij de sessie betrekken. Dit kan heel simpel met een voorstelrondje, een rondje waterstanden, of een eenvoudige vraag die iedereen kan beantwoorden: hoe begon jouw dag, wat was je eerste huisdier, wat voor lekkers onlangs gegeten, etc. Belangrijk is om op dit moment nog uit de inhoud te blijven.

Vervolgens schrijf je doelstelling van de sessie op. Dit heb je natuurlijk goed voorbereid. Kies een doelstelling waar niemand het mee oneens kan zijn. Zorg dat die doelstelling gedurende de hele sessie voor iedereen zichtbaar blijft, zodat eraan gerefereerd kan worden. Dit kan bijvoorbeeld door hem op een flip-over te schrijven en aan de muur te hangen. Anker het doel vervolgens door iedereen zijn persoonlijke doelstelling voor de sessie te laten opschrijven en eventueel te delen. Dat laatste (delen) mag wel, maar hoeft niet.

Tot slot van de introductie moet je zorgen voor de juiste omgeving. Dat is een waarin iedereen vrij durft te spreken en iedereen een gelijkwaardige gesprekspartner kan zijn. Dan helpt om spelregels expliciet en ook weer voortdurend zichtbaar op te hangen: elkaar uit laten praten, geen zijpaden en andere bekende verstoringen van een goed resultaat. Dit is belangrijk, want juist de mensen die vaak het stilst zijn, kunnen met hele goede ideeën komen.

 

2. Tijdlijn

In de tijdlijn probeer je alle feiten naar boven te halen. Feiten zijn in dit geval alles wat je met je zintuigen (kijken, horen, ruiken, proeven, voelen) kunt waarnemen. Probeer chronologisch met de groep alle gebeurtenissen die relevant zijn voor de evaluatie, op een rij te zetten. Beperkt je tot de feiten. Meningen zijn voor later.

 

3. Wat ging goed/wat ging niet goed

In de derde stap ga je met elkaar brainstormen over wat er goed ging en wat niet. Dit kan bijvoorbeeld met twee flip-overs (voor elk een) of een white board met twee helften. Hoe je een goede brainstorm organiseert, staat op veel plekken op internet goed beschreven. Zorg dat daarbij iedereen aan bod komt. Breng niet teveel structuur aan. Dat gaat ten koste van de creativiteit.

 

4. Oplossingen

Vervolgens ga je met elkaar brainstormen over oplossingen van de geconstateerde problemen. Belangrijk is ook hier dat iedereen aan bod komt en de creativiteit vrij spel krijgt. Ook mag er nog bijgeplakt worden bij wat ging goed/niet goed. Vraag verduidelijking als een oplossing niet concreet genoeg is: “Communicatie? Wie met wie? Waarover, Wanneer?” Beperk uitweidingen over stokpaardjes. Vaak zijn dat oude koeien die een goede reden hebben om in sloot te belanden. Het gaat om het krijgen van zoveel mogelijke oplossingen. Niet om het etaleren van het eigen gelijk.

Als je alle oplossingen zo’n beetje verzameld hebt, maak dan een selectie van de meest kansrijke oplossingen. Deze selectie doe je op de verhouding rendement/inspanning. Dit kan bijvoorbeeld door iedereen stippen te laten uitdelen. Iedereen mag dan 10 stippen verdelen over een aantal oplossingen. Beperkt het maximum aantal stippen per oplossing om te voorkomen dat iemand al zijn stippen op zijn of haar favoriete oplossing zet.

 

5. Vervolgafspraken

Nu we de meest kansrijke oplossingen hebben, is het een kwestie van vervolgafspraken maken. Wie moet wat wanneer doen en wat heeft hij of zij daarvoor van wie nodig? Vaak zijn degenen die de oplossing bedenken ook degene die de oplossing kunnen implementeren. Zorg ervoor dat iemand niet alleen maar taken erbij krijgt met het verzinnen van goede oplossingen. Regel ook ruimte en tijd in de agenda’s voor het uitvoeren van te verdelen taken. Daar is vaak een baas bij nodig die tijd, ruimte en middelen kan verzorgen. Als het probleem moet worden opgelost – en dat moet het volgens de aanwezigen in de zaal – dan moet je voor tijd, ruimte en middelen ook de handen op elkaar kunnen krijgen.

Zo kun je een actielijst maken met wie, wat, wanneer af heeft, wat daarvoor nodig is (tijd, middelen) en wie dat moet regelen. De kolommen met wie kunnen alleen gevuld worden met mensen die aanwezig zijn bij de sessie. Heb je iemand nodig buiten de groep? Spreek dan af wie binnen de groep dat regelt. Op die manier creëer je een werkgroep.

Vervolgens bespreek je aan de hand van de actielijst wanneer het zinvol is om weer bij elkaar te komen. En hoe dat geregeld wordt: ter plekke prikken, agendaverzoek, secretariaat, datumprikker. Ook dat levert vast weer een actiepunt op.

Tot slot maak je afspraken over de communicatie: wie moet/mag wat met wie communiceren. En hoe wordt dat dan gecommuniceerd: medium, inhoud boodschap. Mag alles met iedereen gedeeld worden wat hier besproken is? Moet er een samenvatting naar het MT? Is het nieuwswaardig voor intranet? Maak ook afspraken hoe je onderling communiceert als zaken anders lopen dan gedacht en over hoe de voortgang gemonitord wordt.

 

Conclusie

Een gestructureerde evaluatie uitvoeren hoeft niet ingewikkeld te zijn. Als je de vijf stappen voor een goede evaluatie volgt krijg je in mijn ervaring een hele vruchtbare evaluatie. Die iedereen als nuttig en zinvol zal ervaren. En de vervolgacties, mist goed geborgd en opgevolgd, krijgen ook het benodigde draagvlak.

Mocht je nog vragen hebben over de vijf stappen van een goede evaluatie, we komen je graag persoonlijk toelichten hoe jij dit binnen jouw organisatie op de juiste wijze implementeert. Alleen als dit systeem goed wordt toegepast benut je de maximale potentie van dit systeem.

Succes ermee!

 

Vond je dit artikel nuttig? Wil je een handboek dat je altijd overal bij je kunt hebben? En dat bovenstaande stappen tot in detail beschrijft? Laat dan hier je mailadres achter en we sturen het je direct toe!

Hoe je regelmatig terugkerende IT-storingen oplost

Hoe je regelmatig terugkerende IT-storingen oplost

Te veel organisaties hebben regelmatig te maken (grote) IT-storingen. Iedere keer dat ik die verhalen hoor, denk ik: hoe is dit toch mogelijk? In onze ervaring is dit probleem namelijk best wel eenvoudig en snel op te lossen.

Vaak denken mensen dat het probleem wel ingewikkeld zal zijn, of dat er enorme investeringen voor nodig zijn. Het tegenovergestelde is het geval! De meeste van dit soort problemen zijn zonder nieuwe techniek op te lossen. En vragen dus geen enorme investeringen in tijd en/of geld.

Het valt me ook op dat veel organisaties op een of andere manier gewend zijn geraakt aan dit soort storingen. Het hoort erbij. Of: we hebben nu eenmaal deze mensen zitten en die leveren (blijkbaar) deze kwaliteit.

Om deze organisaties te helpen en mijn kennis hiervan te delen, leg ik uit hoe je dit soort problemen in korte tijd en vrij eenvoudig kunt oplossen. En nou maar hopen dat iedereen dit leest!

De oorzaak van ICT verstoringen

Als een systeembeheerder te maken krijgt met een verstoring, gaat hij als eerste na welke wijzigingen er in de afgelopen periode zijn doorgevoerd. Dit is niet zonder reden. Verreweg de meeste ICT-verstoringen worden veroorzaakt doordat iemand iets heeft aangepast en daarbij iets over het hoofd heeft gezien. Ik moet dan altijd denken aan het stroomschema dat ik als plaatje bij dit document hebt bijgevoegd. Erg grappig om te lezen.

Maar als de meeste verstoringen door een menselijke fout veroorzaakt worden, zijn deze dus eenvoudig te voorkomen: door zorgvuldig te handelen. En precies daar zit de oplossing van dit probleem. En daarom zijn er ook geen enorme investeringen nodig. Overigens wordt de rest van de verstoringen veroorzaakt door fouten in de programmatuur, falende hardware, uitvallende stroom en vollopen van de capaciteit.

Als we nu de meeste van die menselijke fouten gaan voorkomen, dan worden incidenten opeens echte incidenten (uitzonderingen). Hoe? Door na elke grote verstoring een evaluatie uit te voeren. Je zult verbaasd zijn. Mijn ervaring is dat door het uitvoeren van vijf van deze evaluaties het aantal grote verstoringen met 80% kan worden teruggebracht. Zo eenvoudig kan het zijn!

Wat is binnen jouw organisatie de grootste oorzaak van ICT verstoringen?

Wil je vaker dit soort artikelen lezen? Schrijf je dan hier in en ontvang maximaal eens per twee weken een nieuw artikel in de mailbox.