Aus dem Kurs: Datenanalyse lernen Teil 1: Grundlagen

Datensets in Abfragen zusammenstellen

Aus dem Kurs: Datenanalyse lernen Teil 1: Grundlagen

Datensets in Abfragen zusammenstellen

Wenn Sie über die Zugriffsrechte auf das Backend einer Datenbank verfügen, dann werden Sie wahrscheinlich Ihre Daten mit Abfragen zusammenstellen. D.h., Sie setzen Joins ein, um das benötigte Datenset zu generieren. Sehen wir uns dazu die Datenbank "Daten mit Abfragen zusammenstellen an". Eine Umfrage, die mit den Befragten an verschiedenen Tagen durchgeführt wurde. Insgesamt wurden 262 Personen befragt. Diese Daten sollen nach Datum analysiert werden. Und wir wollen wissen, an welchen Wochentagen besonders viele Befragungen durchgeführt wurden. Und wir wollen später auch noch wissen, an wie vielen Tagen des Befragungszeitraums Teilnehmende befragt wurden und an wie vielen nicht. Für solche Routinearbeiten mit Datumsangaben haben Sie bereits eine Excel-Tabelle vorbereitet, die Sie in diese Datenbank importieren wollen. Klicken Sie auf die Registerkarte "Externe Daten", dann auf den Befehl "Neue Datenquelle > Aus Datei > Excel", dann klicken Sie auf Durchsuchen, wechseln zum Ordner, in dem sich die Datumstabelle befindet, markieren Sie die Tabelle und bestätigen Sie mit Öffnen. Dann klicken Sie auf OK, auf Weiter. Das Kontrollkästchen "Erste Zeile enthält Spaltenüberschriften" muss aktiviert sein. Weiter, Weiter. Kein Primärschlüssel, Weiter. Und die Tabelle soll Datumstabelle heißen. Bestätigen Sie mit "Fertig stellen" und mit "Schließen". Ihre Datenbank enthält jetzt zwei Tabellen, einmal die Tabelle Studie_Ausgabentrends und einmal die Tabelle Datumstabelle. Sie wollen jetzt wissen, an welchem Wochentag besonders viele Teilnehmende befragt wurden. Dazu erstellen Sie eine erste Abfrage. Wählen Sie auf der Registerkarte "Erstellen" den Befehl "Abfrageentwurf". Dann ziehen Sie die Datumstabelle in den Abfragebereich und dann die Studie_Ausgabetrends-Tabelle. Verknüpfen Sie das offizielle Datum links mit dem Anfangsdatum rechts. Dieser INNER JOIN passt perfekt, weil im Ergebnis nur Datumsangaben gezeigt werden sollen, für die es eine Befragung gegeben hat. Und welche Daten sollen in der Abfrage angezeigt werden? Der WochentagName aus der linken Tabelle und alle Daten aus der rechten Tabelle. Wechseln Sie noch einmal zurück zur Tabelle Studie_Ausgabentrends, um die Anzahl der Datensätze zu prüfen. Hier sind 262 Datensätze enthalten. Dann gehen Sie zurück zur Abfrage und klicken auf der Registerkarte Abfrageentwurf auf die Schaltfläche Ausführen. Das hat geklappt. Alle Wochentagsnamen werden angezeigt und es sind 262 Datensätze. Sie brauchen dafür keine zusätzlichen Berechnungen in Ihrer Datenbank durchzuführen. Der Name des Wochentags ist kein Datum, sondern der zum Datum passende Text. Und mehr brauchen Sie hier auch nicht. Dann speichern Sie noch die Abfrage. Sie soll WochentageUmfrage heißen. Bestätigen Sie den Namen mit OK. Jetzt wollen Sie wissen, ob an jedem Tag innerhalb der Befragungszeit Teilnehmende befragt wurden. Die Befragung erfolgte vom 24.07.2020 bis zum 30.08.2020. Da in der Datumstabelle 5 Jahre abgebildet sind, filtern Sie zunächst die Tabelle in einer Abfrage nach dem Befragungszeitraum. Klicken Sie also wieder auf Erstellen, auf Abfrageentwurf und ziehen Sie die Datumstabelle in den Abfragebereich. Markieren Sie das erste Feld, halten Sie die Umschalttaste gedrückt und markieren Sie das letzte Feld. Jetzt sind alle Felder markiert und Sie können die Auswahl mit gedrückter linker Maustaste nach unten in die Tabelle ziehen. Jetzt fehlt noch das Filterkriterium, und zwar für das offizielle Datum. Das soll zwischen dem 24.07.2020 und dem 30.08.2020 liegen. Access versieht die Datumsangaben automatisch mit dem Nummernzeichen. Klicken Sie auf Ausführen, die Abfrage wird ausgeführt und die 38 Tage, in denen die Umfrage durchgeführt wurde, werden hier gefiltert. Speichern Sie die Abfrage unter dem Namen UmfrageZeitraum. Bestätigen Sie mit OK. Schließen Sie die beiden Abfragen und die Tabelle. Das war die Vorarbeit. Sie wollen immer noch wissen, an welchen Tagen Befragungen stattgefunden haben und an welchen nicht. Sie erstellen also eine neue Abfrage, Erstellen > Abfrageentwurf, Sie ziehen die Abfrage UmfrageZeitraum in den Abfragebereich und die Studie_Ausgabentrends. Dann verknüpfen Sie das offizielle Datum mit dem Anfangsdatum. Und welche Daten sollen in der Abfrage angezeigt werden? Aus der linken Tabelle das offizielle Datum, der WochentagName, der MonatName, das Jahr und die WochentagZahl. Und aus dem rechten Bereich wollen Sie das Anfangsdatum und die Teilnahme ID anzeigen lassen. Aufgepasst, hier muss der JOIN-Typ angepasst werden. Sie wollen alle Datensätze des Abfragezeitraums sehen, d.h., alle 38 Tage des Befragungszeitraums sollen angezeigt werden, egal ob es Befragungen gab oder nicht. Sie klicken also mit der rechten Maustaste auf die Verknüpfungslinie und wählen den Befehl Verknüpfungseigenschaften. Hier ist die zweite Option die richtige. Alle Datensätze aus der Abfrage UmfrageZeitraum, d.h. alle Umfragetage, egal ob eine Befragung stattgefunden hat oder nicht. Bestätigen Sie mit OK und führen Sie die Abfrage aus. Für welches Datum gibt es keine Umfragedaten? Blättern wir durch die Tabelle und ganz unten sehen Sie, es gibt hier wirklich einige Tage, an denen keine Befragungen stattgefunden haben, z.B. am 8.8. Und am 9.8. Und wie viele Datensätze sind das insgesamt? Klicken Sie mit der rechten Maustaste in die Abfrage und wechseln Sie in die Entwurfsansicht. Und dann vergeben Sie ein Filterkriterium, und zwar für das Anfangsdatum. Sie wollen wissen, welche Datensätze kein Anfangsdatum enthalten und dann geben Sie hier entweder das englische "Is Null" oder das deutsche "Ist Null" ein und dann klicken Sie auf Ausführen. 20 Datensätze enthalten also keine Umfragedaten. Wechseln Sie zurück in die Entwurfsansicht und löschen Sie dieses Filterkriterium. Dann führen Sie die Abfrage erneut aus und haben wieder Ihre 281 Datensätze. Vielleicht ist Ihnen auch schon aufgefallen, das Ergebnis 281 Datensätze passt hier irgendwie nicht. Die Studientabelle enthält 262 Datensätze, wie Sie sich vielleicht noch erinnern können. Und jetzt sind noch 20 Datensätze dazugekommen, die keine Befragungsdaten enthalten. Das macht insgesamt eigentlich 282 Datensätze. D.h., es fehlt ein Datensatz. Ist das ein Fehler oder ist das korrekt? Das müssen Sie unbedingt prüfen. Öffnen Sie die Tabelle Studie_Ausgabentrends und dann filtern Sie das Datum absteigend. Und schon sehen Sie den Fehler. Dieser Datensatz 02.09. liegt außerhalb des Umfragezeitraums und dieses Datum wurde in der Abfrage automatisch ausgeschlossen. Gott sei Dank, es ist also alles korrekt. Dann speichern Sie noch die Abfrage. Sie soll "AlleUmfrageTage" heißen. Bestätigen Sie mit OK. Sie sehen, wenn Sie Daten benötigen, die im Prozess nicht abgebildet werden, dann können Sie mithilfe zusätzlicher Daten sowie mithilfe von Abfragen und Joins die erforderlichen Datensätze generieren.

Inhalt