Data Lake

Unter dem Begriff versteht man die Speicherung der Daten in ihrem Rohformat. Bei Data Lake werden die Rohdaten erst in ein anderes Format umgewandelt, wenn sie verwendet werden. Dies nennt man auch Schema-on-Read und ist ein kostengünstiges, schnelles Verfahren. Für entsprechende Analysen der Big Data ist dies ein guter Ausgangspunkt, da aufgrund des Aufbaus die Plattform auch als Data-Management genutzt werden kann. Die flache Datenstruktur ermöglicht damit neue Zusammenhänge zu erkennen.