Data Cleansing

Wat betekent Data Cleansing?

Data cleansing is het proces waarbij data in een bepaalde opslagbron worden gewijzigd om ervoor te zorgen dat ze nauwkeurig en correct zijn. Er zijn veel manieren om data op te schonen in verschillende software- en databases; de meeste zijn gericht op het zorgvuldig beoordelen van datassets en de protocollen die horen bij een bepaalde databasetechnologie.

Het opschonen van data wordt ook wel data cleaning of data scrubbing genoemd.

Techopedia legt Data Cleansing uit

Het opschonen van data is een proces waarbij oude of nutteloze gegevens uit een dataset worden verwijderd. Hoewel het opschonen van data het verwijderen van zowel oude, onvolledige of dubbele gegevens kan inhouden, richt het opschonen van data zich specifiek op het maximaliseren van de nauwkeurigheid van gegevens in een systeem. Een methode voor het opschonen van data is parsing, waarbij syntaxisfouten, typografische fouten of fragmenten van data kunnen worden verwijderd. Een zorgvuldige analyse van een dataset kan laten zien hoe het samenvoegen van meerdere sets heeft geleid tot duplicatie. In dat geval kan data cleansing worden gebruikt om het probleem op te lossen.

Veel problemen met het opschonen van gegevens zijn vergelijkbaar met problemen waar archivarissen, databasebeheerders en anderen mee te maken krijgen bij processen als gegevensonderhoud, gerichte datamining en de ETL-methodologie (extract, transform, load), waarbij oude gegevens opnieuw worden geladen in een nieuwe datasset. Deze problemen hebben vaak te maken met de syntaxis en het specifieke gebruik van commando’s om gerelateerde taken uit te voeren in database- en servertechnologieën zoals SQL of Oracle. Databasebeheer speelt een zeer belangrijke rol in veel bedrijven en organisaties die afhankelijk zijn van grote datasets en nauwkeurige gegevens voor handel of andere initiatieven.

Gerelateerde Begrippen

Laatste Database Begrippen

Gerelateerde Artikelen

Margaret Rouse

Margaret Rouse is een bekroond technisch schrijver en docent die bekend staat om haar vermogen om complexe technische onderwerpen uit te leggen aan een niet-technisch, zakelijk publiek. In de afgelopen twintig jaar is haar uitleg verschenen op vele websites en is ze als autoriteit aangehaald in artikelen van de New York Times, Time Magazine, USA Today, ZDNet, PC Magazine en Discovery Magazine. Margaret geniet ervan om IT- en business professionals te helpen om elkaars zeer gespecialiseerde talen te begrijpen. Als je een suggestie hebt voor een nieuwe definitie of hoe je een technische uitleg kunt verbeteren, stuur Margaret dan een…