Welche Rolle Datenqualität und Data Governance beim Data Management für Analytics spielen, habe ich mit meinem Kollegen Gerhard Svolba zuletzt an dieser Stelle diskutiert. Doch was genau macht modernes Datenmanagement aus, und welche Rolle spielen dabei neue Technologien à la Hadoop und Co.? Und wie sieht überhaupt die künftige Zusammenarbeit
Tag: Hadoop
Die aktuelle BARC-Studie verrät die Sicht der Unternehmen auf modernes Datenmanagement mittels Hadoop und Data-Lake-Konzepten. Die Anwenderbefragung gibt einen interessanten Blick auf den derzeitigen Status von Hadoop und Data Lakes in Europa und Nordamerika. Wo wird das Ecosystem eingesetzt, was ist der erhoffte Nutzen, und wo sind die Grenzen, um
Dies ist der zweite Teil der Blog-Serie zu Big Data Governance. Beginnen Sie vorher am besten mit „Teil 1: Wie Big Data Unternehmen durcheinanderwirbelt”, wenn sie ihn noch nicht gelesen haben.
Liz Maria Muller Junior ist aktiv im Netz unterwegs, dort vernetzt und meinungsbildend. Ihre Meinungen schätzen ihre „Follower“; das hat „ihr Data Scientist“ schon rausgefunden und ihr das Attribut „Influencer“ verpasst. Nach vielem Abmühen in seiner neuen Hadoop-Sandbox macht das ihren Data Scientist ein bisschen stolz: Eine wertvolle Neukundin wäre
Hadoop feiert seinen 10. Geburtstag und ist zum Synonym für Big Data geworden. Mit rasant steigendem Datenvolumen werden aber auch die Herausforderungen bezüglich Datengüte größer. Ich hatte bereits einen Beitrag dazu geschrieben. Teil 1 finden Sie hier.
Offener Quelltext, freie Verfügbarkeit, Begeisterung und Engagement für eine Sache, einfach loslegen und mit der Umsetzung anfangen und die Weiterentwicklung durch viele Personen – das sind einige Punkte, die Open Source auszeichnen.
Ein Data Lake ist ein Konzept zur Speicherung von Daten in einem Hadoop-Cluster. Es entstehen heutzutage an vielen Stellen Daten, welche aus Kostengründen nicht ins klassische Data Warehouse fließen. Doch könnten mit diesen Daten zusätzliche Assets generiert werden, vorausgesetzt man speichert sie an einem Ort und hat dann eine analytische
Es tut sich was in Sachen Big Data Analytics und Hadoop in den Unternehmen. Hat man vor 12 Monaten noch eher darüber diskutiert, ob Big Data ein weiterer Hype von Analysten und Beratern ist, stellt sich die Situation heute ganz anders dar: Das Thema ist in den Unternehmen angekommen.
Angenommen, ein Chemiker hat eine riesige Menge verschiedener Rohstoffe zur Verfügung. Er hat die Aufgabe aus diesen Rohstoffen ein neues Medikament zu entwickeln. Der Chemiker weiß noch nicht wofür, aber mit Hilfe seines Fachwissens über chemische Stoffe macht er sich daran, kreativ Ideen zu entwickeln. Er fängt an, eine Auswahl
SAS und Hadoop: Immer mehr Unternehmen stellen Überlegungen zum Einsatz von Hadoop als Framework für verteiltes Speichern und Verarbeiten großer Datenmengen an. Gerade für das Speichern von un- oder semistrukturierten Daten wie soziale Medien, Blogs, Foren, Online-Shops oder maschinengenerierte Sensordaten bietet sich diese Plattform an. Natürlich besteht häufig der Wunsch,