Data Scientists verbringen eine Menge Zeit mit Daten. Dabei gilt immer – von der Anwendung von Machine-Learning-Modellen bis hin zum Trainieren von KI-Modellen: Mit der Datenqualität stehen und fallen die Ergebnisse. Analytics und Data Science stellen jedoch nicht nur Ansprüche an Datenqualität. Sie können auch dazu beitragen, diese zu verbessern.
Tag: Datenqualität
Die Erfahrung aus Lehman Brothers oder dem Zahlungsausfall bei griechischen Staatsanleihen hat gezeigt, dass die bisherigen bankinternen Strukturen zur Steuerung der Institute nicht mehr der Vielzahl an Marktänderungen gerecht werden. Im Januar 2013 veröffentlichte das Basel Committee on Banking Supervision die „Grundsätze für die effektive Aggregation von Risikodaten und die Risikoberichterstattung“
Lenin und ich sitzen im Publikum und applaudieren heftig: Seine Chefin hat ihren Vortrag beendet über „Datenqualität als Erfolgsfaktor im Internet of Things“. „Kein Datenqualitätsprojekt ohne Hilfe von oben“, raunt Lenin mir zu, "Unterstützung vom Boss ist manchmal wichtiger als tolle Software." Ich will beleidigt darauf hinweisen, dass seine Chefin
Auch wenn der Hype von Gartner für beendet erklärt wurde: An Big Data und der Auswertung entsprechender (oftmals unstrukturierter) Datenmengen kommt kein Unternehmen vorbei. Doch welche Herausforderungen stellen Big Data und damit einhergehende Entwicklungen an das Data Management? Wie können Data Scientists, IT und Fachabteilung heute zusammenarbeiten? Und wo prallen
Lenin hatte gelächelt und von seinen Erfolgen im Internet of Things berichtet; richtig begeistert war er gewesen. – Aber jetzt murrt er: „Das ist alles Müll! Internet of Trash sollte es heißen! Die Daten stimmen nicht, die Leute schimpfen über das Projekt, der Fachbereich und meine Chefin sitzen mir im
Digitalisierung, Big Data, IoT, Smart Data – die Liste an Ansätzen, die den Klassiker „aus Daten mach Umsatz“ neu definieren wollen, wird länger und länger. An cleveren, schlüssigen und vielversprechenden Methoden mangelt es sicher nicht, ihnen allen gemein ist aber der mahnende Zeigefinger und ewige Spielverderber Datenqualität. Und wie das
Datenqualität ist ein Thema, das in Versicherungen häufig thematisiert wird, im Projektalltag aber ebenso häufig eine untergeordnete Rolle spielt. Ich habe Karen Prillwitz zum Stellenwert des Themas Datenqualität bei großen Versicherern befragt. Karen Prillwitz hat viele Jahre Versicherungen beraten und als Projektleiterin in einem großen deutschen Versicherungskonzern die Auswirkungen schlechter
Matchcodes spielen bei der Identifizierung von Dubletten eine zentrale Rolle. Um die Dubletten anhand von Matchcodes zu finden, müssen die Daten meistens erst noch aufbereitet werden. Stehen beispielsweise Anrede und Vor-/Nachname oder Straße und Hausnummer im selben Feld, müssen diese separiert werden, dadurch können bessere Match-Ergebnisse erzielt werden.
Unternehmen leben von der Qualität ihrer Daten. Banal bis fatal. Die Realität ist eher: Unternehmen überleben trotz der schlechten Qualität … Auf Nachfrage bekennen fast alle Befragten (98 Prozent), dass eine weitere Verbesserung der Datenqualität in ihrem Unternehmen positive Auswirkungen hätte. Mehr als die Hälfte sah da Chancen, etwas zu
Liz Maria Muller Junior ist aktiv im Netz unterwegs, dort vernetzt und meinungsbildend. Ihre Meinungen schätzen ihre „Follower“; das hat „ihr Data Scientist“ schon rausgefunden und ihr das Attribut „Influencer“ verpasst. Nach vielem Abmühen in seiner neuen Hadoop-Sandbox macht das ihren Data Scientist ein bisschen stolz: Eine wertvolle Neukundin wäre
Aktuell sprechen wir mit vielen Banken über das Management ihrer Daten. Historisch schien die Bereitstellung von Information hinlänglich gelöst: Die IT-Abteilungen stellten diverse Mart-Daten & Analyse-Tools bereit. Punkt. Banken-Daten-Management: Mehr Schein als Sein?