Seit einigen Jahren wird der Begriff "Data Science" oftmals in Zusammenhang mit "Künstliche Intelligenz", "Maschinenlernen" und "Neuronale Netze" genannt.
Aber auch ganz allgemeine Begriffe wie "Business Intelligence" oder "Big Data" werden mit den Vorgenannten gerne vermischt, sodass ein unscharfes Begriffschaos entsteht, in dem sich viele Akteure bewegen und in dem man leicht den Überblick verlieren kann.
Die deutschsprachige
Wikipedia bezeichnet mit Data Science "...generell die Extraktion von Wissen aus Daten".
Anders ausgedrückt, geht es grundsätzlich darum, mit Hilfe von Daten Fragen zu beantworten und Wissen zu generieren.
Doch weniger den Begriff "data", als vielmehr die "Science" bezeichnet
Leek als das eigentlich Relevante.
Denn die Herausforderung besteht nicht darin, möglichst große Datenmengen ("Big Data") zu generieren, denn die Daten fallen
nachweisbar durch immer mehr automatisierte Prozesse sowieso an. Hier ist an Industrie 4.0, an smart Life und Soziale Medien zu denken. Laut
IBM stellen hierbei Transaktionen und Log-Files die größten internen Quellen und Soziale Medien und Audio-/Video- und Bilddaten die größten externen Datenquellen dar.
Die Herausforderung – und damit unsere Aufgabe – besteht im Zusammenspiel von Fragestellung, Daten und Methoden, die richtigen Entscheidungen zu treffen.