Managed hosting door True
Deze opinie is van een externe deskundige. De inhoud vertegenwoordigt dus niet noodzakelijk het gedachtegoed van de redactie.

Hadoop is een technologie, geen strategie

 

Computable Expert

Rein Mertens
Senior Manager, SAS Nederland. Expert van Computable voor de topics Business Analytics en Datamanagement.

Je zou als IT-architect maar bij een grote onderneming werken en de vraag krijgen: wat is onze big data-strategie? In één adem daar achteraan volgt dan de vraag: doen wij ook iets met Hadoop? Big data en Hadoop lijken onlosmakelijk met elkaar verbonden. Ik zie bij veel organisaties een gevoel ontstaan van ‘we moeten hier iets mee en wel zo snel mogelijk’. Dit echter zonder dat precies duidelijk is wat men met de technologie kan of wil bereiken.

Uit angst niet achter te blijven wordt Hadoop gebombardeerd tot de big data-strategie van het bedrijf. Dan doen we immers mee met de rest en hebben we een antwoord op de gestelde vragen. Vanuit mijn optiek is dit geen wenselijke situatie. Ja, Hadoop is een krachtige technologie, maar niet het logische antwoord op de grote big data-vraag.

Business case

Een eerste belangrijke stap bij het bepalen of het goed is om aan de slag te gaan met Hadoop, is het bouwen van de business case. Dit is bij de ene partij een eenvoudiger proces dan bij de andere. Zo is het bijvoorbeeld voor online retailers evident. Zij hebben bij uitstek veel te maken met data rondom webgedrag en willen dit kunnen combineren met bestaande klantgegevens uit het datawarehouse om daarmee  zo mogelijk direct aanbevelingen te kunnen doen op basis van koopgedrag van vergelijkbare klanten. Het gaat hierbij om zoveel data dat je al snel kunt concluderen dat alleen een Hadoop-omgeving dit tegen aanvaardbare kosten kan doen. Alleen door het opbouwen van een goede business case kun je de investering in Hadoop voldoende rechtvaardigen.

Investering? Ja, want ondanks dat Hadoop open source is heb je wel degelijk te maken met kosten. Zo bevat Hadoop veel verschillende technologieën, die bovendien voortdurend in ontwikkeling zijn.Om met het platform te werken is kennis hiervan onmisbaar en het opdoen van kennis vereist nou eenmaal een investering. Ook wekt het feit dat het platform open source is de indruk dat het een ‘plug and play’-oplossing is. Echter om de voordelen van Hadoop maximaal te benutten, is het downloaden pas het begin.

Factoren

Als de business case sterk is en de kenniscomponent is ingevuld, lijkt het alsof het licht voor de implementatie op groen staat. Echter als dit platform gebruikt gaat worden in (cruciale) informatievoorzieningsprocessen, moet nog een aantal factoren op orde  zijn: 

- Toegang tot data
Data kan in een Hadoop-omgeving op verschillende manieren fysiek worden opgeslagen, waarbij het niet vanzelfsprekend is dat je de data transparant, efficiënt en eenvoudig kan benaderen, bewerken en beheren. Eenduidige toegang is belangrijk bij Big Data-toepassingen. Je tools voor toegang en connectiviteit moeten op eenzelfde manier bij de Hadoop-omgeving kunnen aansluiten zoals rdbms'en en enterprise applicaties.

- Beveiliging 
Verzeker jezelf ervan dat er veiligheidsmaatregelen zijn genomen rond je Hadoop omgeving. Als je je bedrijf bestuurt vanuit dit platform, dan wil je niet dat iedereen zomaar toegang heeft. Ook wil je zeker weten dat het systeem niet down gaat en je daarmee geen toegang meer hebt tot je data.

- Performance 
Hadoop is ontworpen voor big data, maar je moet het platform wel beheren om de beste prestaties te kunnen halen. Denk erover na hoe je sla’s gaat halen en zorg ervoor dat je voldoende kennis hebt van de omgeving en de mogelijkheden van de software die je gebruikt. Een juiste balans tussen capaciteit en workload is belangrijk binnen Hadoop.

- Integratie 
Zorg dat duidelijk is hoe Hadoop aansluit en zich verhoudt tot de andere componenten in je infrastructuur. Het is belangrijk te begrijpen hoe de hardware omgaat met de groei van de workload. Zorg dat het op het juiste niveau werkt, begrijp welke informatie erin komt en welke informatie eruit gaat. De slimste bedrijven combineren ideeën en inzichten voor big data met hun traditionele databronnen. Een goede Hadoop-implementatie benut de voordelen van de beschikbare all in-memory implementatiescenario’s. Dit zorgt voor significant betere analyses en  geeft vertrouwen aan degenen die de beslissingen moeten nemen.

Strategie

Het is duidelijk dat de keuze voor Hadoop een weloverwogen beslissing moet zijn waarbij de implementatie en het gebruik ook de nodige aandacht vereisen. Alleen dan kun je zorgen dat deze technologie een positieve bijdrage kan leveren aan je big data-strategie en uiteindelijk aan je bedrijfsdoelstellingen.

Dit artikel is afkomstig van Channelweb.nl (https://www.channelweb.nl/artikel/4998952). © Jaarbeurs IT Media.

?

 

Stuur door

Stuur dit artikel door

Je naam ontbreekt
Je e-mailadres ontbreekt
De naam van de ontvanger ontbreekt
Het e-mailadres van de ontvanger ontbreekt

×
×
Wilt u dagelijks op de hoogte worden gehouden van het laatste ict-nieuws, achtergronden en opinie?
Abonneer uzelf op onze gratis nieuwsbrief.