Aus dem Kurs: Datenanalyse lernen Teil 1: Grundlagen

Die Originaldaten sicher aufbewahren

Aus dem Kurs: Datenanalyse lernen Teil 1: Grundlagen

Die Originaldaten sicher aufbewahren

Datenanalyse könnte so einfach sein. Sie greifen auf die Systeme zu, in denen die Daten abgelegt sind, und stellen sich die Datensets zusammen, die Sie benötigen. Aber so ist es leider nicht immer. Vielleicht bekommen Sie einfach nur ein Tabellenblatt. Vielleicht können Sie nicht auf alle benötigten Daten zugreifen. Oder vielleicht bekommen Sie auch eine CSV-Datei. Egal, wie die Daten zu Ihnen gelangen, es ist wichtig, dass Sie dafür sorgen, dass diese Originaldaten in irgendeiner Form unverändert erhalten bleiben. Das hat gleich zwei Vorteile. Sollte etwas schieflaufen, müssen Sie nicht wieder von vorne anfangen. Und Sie können gut nachverfolgen, was Sie mit Ihren Daten gemacht haben. Stellen Sie sich folgendes Szenario vor. Sie verfügen nicht über die benötigten Zugriffsrechte, um das Datenset für einen Monatsbericht selbst zusammenzustellen. Das erledigt die Datenbank-Administration und die IT-Abteilung für Sie. Sie erhalten die Daten per Mail. Sie bereiten die Daten auf, erstellen die Berichte und präsentieren sie im Team, und das jeden Monat. In einem solchen Szenario ist es empfehlenswert, die Originaldaten, die Sie per Mail bekommen, in einem separaten Ordner zu speichern. Sie stehen natürlich weiterhin in der Mail zur Verfügung, aber ich persönlich möchte mich nicht nur darauf verlassen. Sicher ist sicher. Benennen Sie den Ordner dann mit einem passenden Namen, z.B. mit "Originaldaten". Und genau das tun wir jetzt im Windows Explorer im Übungsordner KAP04 > 04_05. Dort befindet sich die Datei mit den Originaldaten, die Sie per Mail bekommen haben. Um den Unterordner für die Originaldaten zu erstellen, klicken Sie mit der rechten Maustaste in das Fenster und wählen den Befehl "Neu" und dann "Ordner". Der Ordner soll "Originaldaten" heißen. Dann ziehen Sie die Originaldatei mit gedrückter linker Maustaste in den neuen Ordner. Und damit diese wertvollen Daten auf keinen Fall verändert werden können, schützen Sie sie folgendermaßen: Doppelklicken Sie auf den Ordner, klicken mit der rechten Maustaste in den Dateinamen, wählen den Befehl "Eigenschaften" und aktivieren das Kontrollkästchen "Schreibgeschützt". Bestätigen Sie mit OK, und Ihre Originaldaten sind in Sicherheit. Erstellen Sie jetzt eine Arbeitskopie, in der Sie Ihre Berichte erstellen. Doppelklicken Sie auf den Dateinamen, um die CSV-Datei "Schreibgeschützt" in Excel zu öffnen. Drücken Sie dann die Funktionstaste F12. Das Dialogfeld "Speichern unter" wird geöffnet. Hier bestimmen Sie, wo Ihre Arbeitsdatei gespeichert wird, in welchem Dateiformat sie gespeichert wird und wie sie heißen soll. Sie soll im Ordner "04_05" gespeichert werden, sie soll den Namen "Personaldaten_Arbeitsdatei" bekommen. Und damit die gesamte Excel-Funktionalität zur Verfügung steht, speichern Sie sie als Excel-Arbeitsmappe ab. Bestätigen Sie mit "Speichern". Prüfen Sie dann sicherheitshalber auf der Registerkarte "Datei" mit dem Befehl "Informationen", dass für diese Datei kein Schreibschutz besteht. Perfekt. Die Originaldatei befindet sich jetzt also schreibgeschützt im Ordner Originaldaten. Und Sie haben eine Arbeitsdatei erstellt, mit der Sie experimentieren können. Und sollte dabei etwas schiefgehen, können Sie jederzeit auf die Originaldaten zurückgreifen. Jetzt geht es an die Datenbereinigung. Für diese Datei gibt es drei Schritte, die Sie immer wieder machen müssen. Eine Art Grundreinigung. Doppelklicken Sie links oben auf das Feld, um alle Daten zu markieren, und dann doppelklicken Sie auf eine Trennlinie zwischen den Spalten, um für alle Spalten die optimale Spaltenbreite einzustellen. Jetzt sind alle Daten sichtbar. Dann wissen Sie, dass Sie drei Spalten nicht benötigen, und zwar die Spalten B, C und D. Markieren Sie die Spalten, klicken Sie mit der rechten Maustaste in die Markierung und wählen Sie "Zellen löschen". Im dritten Schritt wollen Sie die Spaltenbezeichnungen formatieren. Der Cursor ist in der Zelle A1. Drücken Sie jetzt die Tastenkombination Strg-Taste + Umschalttaste + Pfeil nach rechts, um alle Spaltennamen zu markieren. Dann klicken Sie z.B. auf der Registerkarte Start auf die Schaltfläche Fett. Diese grundlegende Datenbereinigung werden Sie mit diesem Datenset immer wieder durchführen. Es ist also eine gute Idee, auch diesen Stand separat zu speichern, und zwar under dem Namen "Personaldaten_Basisreinigung". Bestätigen Sie mit "Speichern". Zurück zur Arbeitskopie. Sie enthält die bereinigten Arbeitsdaten, und bevor Sie sich diese Daten näher ansehen, erstellen Sie noch im letzten Schritt eine Kopie des Arbeitsblattes. Dazu klicken Sie mit der linken Maustaste auf den Blattnamen, drücken gleichzeitig die Strg-Taste und ziehen danach rechts. Der Mauszeiger erhält ein Blattsymbol mit einem Pluszeichen darin. Daran können Sie erkennen, dass Sie eine Kopie des Arbeitsblattes erstellen. Sobald Sie die Maustaste und die Strg-Taste loslassen, wird die Kopie erstellt und Sie können in den Namen doppelklicken, um das Blatt umzubenennen. Es soll "Personaldaten Arbeitskopie" heißen. So können Sie bei Bedarf immer auf das Originalblatt zurückgreifen. Es ist wichtig, dass die Ordnerstruktur sowohl für Sie als auch für alle anderen verständlich ist. Sorgen Sie dafür, dass die Originaldaten erhalten bleiben und dass der Stand der Basisbereinigung in einer separaten Datei gespeichert wird. Wo genau Sie die Daten speichern, ist überall anders. Vielleicht in einem Ordner auf dem Server oder in der Cloud. Aber egal, wo Sie sie speichern, sollte etwas schiefgehen, können Sie jederzeit darauf zurückgreifen. Und genau das ist der Sinn der Sache.

Inhalt