De informatiebron voor het Nederlandse ICT-resellerkanaal   Adverteren | Mobiel | Contact  
CRN
 Zoek
Nieuwsbrief
Reacties
Bedrijvengids
Channel Guide
CRN Mobiel



Nieuws aanmelden
Agendapunt melden
RSS-feed Volg ons via Twitter

 
Opinie
 Terug Mail aan een vakgenootPrintvriendelijke versie   

Contentindexing is het antwoord op big data

Bedrijven en organisaties verzamelen steeds meer data. Documenten, presentaties, spreadsheets, databasegegevens, maar ook video's, foto's en illustraties. Dat levert niet alleen technische, maar ook organisatorische uitdagingen op. Technisch gesproken zal een bedrijf voldoende disks of tape moeten aanschaffen om alle gegevens te bewaren. Vanuit organisatorisch oogpunt zal het nodig zijn dat informatie ook terug te vinden is. Daarnaast is het de vraag of een organisatie wel alles langdurig moet opslaan? Opslag wordt weliswaar elke dag goedkoper, maar het beheer ervan niet. Contentindexering kan hier uitkomst bieden.

Datawarehouse

Iedereen maakt het weleens mee: je zoekt naar een presentatie in je mailbox of in een map, maar je weet niet meer precies hoe het document heet. Zoeken op naam levert niets op. Je bent intussen een kwartier verder, maar het bestand is nog niet gevonden. Diverse onderzoeken naar dit verschijnsel laten zien dat we steeds meer tijd kwijt zijn aan zoeken. Dat geldt niet alleen voor individuele gebruikers, maar ook voor organisaties als geheel. Het is duidelijk dat we tools nodig hebben om de spreekwoordelijke speld in een hooiberg te vinden.

Dit klemt te meer nu big data op de agenda van bedrijven komt te staan. We praten niet langer over gigabytes of terabytes, maar over petabytes en exabytes. Daarbij levert het opslaan van data per definitie nog geen informatie op. Dat is juist het probleem voor veel organisaties. Zo verzamelen supermarkten grote hoeveelheden verkoop- en klantdata. Daar willen ze iets mee, zoals een trend destilleren of nieuw beleid formuleren. Om te beginnen zal die informatie doorzoekbaar moeten zijn. Dat gebeurt in toenemende mate door het inzetten van contentindexering.

Hierbij is niet langer de bestandsnaam of de (sub)directory leidend, maar de inhoud. Een indexeringtool 'leest' de inhoud van elk bestand en stelt vast of het voldoet aan de zoekopdracht van de gebruiker. Contentindexering is online en offline mogelijk. Offline komt het meeste voor, omdat hier de productieomgeving ongemoeid gelaten kan worden. Pas na het back-uppen of archiveren vindt indexering plaats. Dat scheelt niet alleen in de kosten doordat minder resources nodig zijn, maar het is ook veiliger. Actieve gegevens zijn relatief dynamisch. De gebruiker verplaatst deze makkelijk. Dat maakt online contentindexering foutgevoelig doordat een document bijvoorbeeld na het indexeren door een gebruiker verplaatst is. Back-ups en archieven zijn veel statischer en daardoor bij uitstek geschikt voor contentindexering.

Beveiliging

Een belangrijk aandachtspunt bij contentindexering is uiteraard beveiliging. Een organisatie zal immers willen voorkomen dat medewerkers via zoekopdrachten toegang krijgen tot bestanden die ze normaal gesproken niet kunnen openen, omdat ze daartoe de rechten niet hebben. Dit vereist dus van een indexeringtool dat die te integreren is met bijvoorbeeld de Active Directory, zodat de rechtenstructuur ook bij het zoeken intact blijft.

Contentindexering speelt vooral in de Verenigde Staten een belangrijke rol in legal search. Bij (juridische) conflicten is met een eenvoudige zoekopdracht in een keer alle relevante documentatie rond bijvoorbeeld een order te ontsluiten. In Europa komt dit nog maar beperkt voor, mede doordat de EU-landen verschillende regels hanteren voor wat betreft schriftelijk bewijsmateriaal. De Europese Commissie werkt overigens wel aan meer harmonisatie op dat gebied. Dit kan betekenen dat legal search ook in de EU op termijn vaker ingezet zal worden.

Redundantie

Contentindexering speelt verder een nuttige rol bij het voorkomen van redundantie. Gebruikers en it-beheerders zijn vaak terughoudend in het wissen van bestanden. Je kunt immers nooit weten of iets nog eens nodig is... Door op inhoud te indexeren, is te bepalen welke bestanden nog nuttig en nodig zijn om actief te worden gehouden, en welke beter een plek kunnen krijgen op goedkopere archiefopslagmedia.

Big data zal de komende tijd steeds hoger op de agenda van organisaties komen te staan. Contentindexering is een van de uitstekende middelen om de uitdagingen op dit gebied aan te gaan.

Michiel von der Crone
Director Field Advisory Services Team EMEA
CommVault


Michiel von der Crone 
 
 
 
 Reageer op dit artikel 
 
Meer Opinie:
22 mei 13:42
Documenten dubbel zien in de cloud
22 mei 10:11
Denk in diensten en niet in uren maal tarief
21 mei 14:02
Beveilig je site tegen DDoS-aanval
21 mei 10:14
Maak je proces mobiel met een app
17 mei 15:09
De Red Diesel Blues
17 mei 10:39
Efficiency en kostenbesparing dient de IT-mens
16 mei 13:41
Groei IT-budgetten bij grote ondernemingen
15 mei 13:57
Big data opvangen met open hybride cloud
14 mei 11:04
Noem man en paard bij cloud computing
13 mei 13:40
BYOD onmogelijk door logge software
8 mei 14:08
Cloud aggregator krijgt rol in IT-markt

  
Sponsored links



Adverteren  |   Disclaimer  |   Privacy  |   Cookiebeleid  |   IT Banen  |   Computable  |   CRN  |   Tweakers.net  |   IT Knowledge Base  |   Autotrack.nl  |   Carsom.nl

Alle rechten voorbehouden © De Persgroep