Big Data, Cloud und Data Science sind in aller Munde und Data Scientists sind sehr gefragt. Auch bei managetopia sehen wir eine immer größere Nachfrage bei unseren Kunden zur Unterstützung bei Data Science Projekten. Kunden, die in der Vergangenheit mit einfachen Analysen auf Basis der Mittel von SQL-Datenbanken und Excel zufrieden waren, möchten heute oft mehr.
Obwohl wir bei managetopia schon länger einen Anstieg im Interesse zum Thema Data Science feststellen konnten, war die Überraschung trotzdem recht groß, als ein langjähriger Kunde eine Projektanfrage stellte für die Erstellung eines Vorhersagemodells. Ziel war es, eine Machbarkeitsstudie durchzuführen zur möglichen Unterstützung von Investitionsentscheidungen durch ein Prognosemodell. Die Fragestellung war: Kann man Rückschlüsse auf den heutigen Erfolg von Firmen ziehen, basierend auf diversen Kennzahlen aus der Vergangenheit.
Neben dem Aufwand für die Erstellung der Modelle fällt ein Großteil der Arbeit üblicherweise für die Datenbereinigung an. Da viele der Datenquellen aus Excel Dateien bestanden – ca. 100 Excels mit Information zu verschiedenen Firmen - und die Daten Excel-typisch über viele Blätter mit unterschiedlichen Strukturen verteilt waren, lag es nahe, eine Lösung mit Hilfe der Microsoft Office Techniken zu entwickeln: Excel und VBA.
Neben dem Aufwand für die Erstellung der Modelle fällt ein Großteil der Arbeit üblicherweise für die Datenbereinigung an. Da viele der Datenquellen aus Excel Dateien bestanden – ca. 100 Excels mit Information zu verschiedenen Firmen - und die Daten Excel-typisch über viele Blätter mit unterschiedlichen Strukturen verteilt waren, lag es nahe, eine Lösung mit Hilfe der Microsoft Office Techniken zu entwickeln: Excel und VBA.
Die Vorteile von Python liegen vor allem in der breiten Unterstützung in der Data Science Community und der unzähligen vorliegenden Erweiterungen für die Sprache. Besonders nützlich erwiesen sich im Rahmen dieses Projektes 2 Erweiterungen: Pandas und scikit-learn. Ersteres liefert vorgefertigte Datenstrukturen und Funktionen zur Datenbereinigung und Analyse. Letzteres lieferte die benötigten Prognosemodelle inklusive der Funktionalität zur Optimierung der Modelle. Im Projekt konnten wir dadurch, insbesondere im Vergleich zur Umsetzung mit VBA, erhebliche Einsparungen an Zeit und Kosten realisieren und dem Kunden innerhalb kürzester Zeit die gewünschten Modell liefern.
Die Entscheidung über den Erfolg der Machbarkeitsstudie Studie für das fachliche Prognosemodell steht noch aus und es nicht klar, ob der Ansatz weiter verfolgt wird. Python als Sprache und die zugehörigen Frameworks haben sich allerdings in dem Projekt bewährt und mit der zunehmenden Nutzung von Unternehmensdaten werden sich in Zukunft mit Sicherheit noch weitere Analyse-Projekte auf managetopia zukommen.
Du interessierst dich für unser Lösungsportfolio oder hast eine Projektanfrage?
Wir finden eine passende Lösung für dein Problem.