7. Vorlesung
Ich sitze ein wenig ratlos vor meinem Laptop und versuche meine 3000 Zeichen zur 7. Vorlesung auf das Papier, respektive auf den Bildschirm zu bringen. Nicht dass die Vorlesung nicht gut gewesen wäre. Aber die Übungen mit OpenRefine waren einfaches Befolgen von Anleitungen und ich holte nicht wirklich eigene Erkenntnisse daraus, die ich nun aufzeigen könnte. Und als “Von CSV zu MARCXML” kam, war ich recht verloren.
Doch von Anfang an:
OpenRefine ist ein Tool, welches für einen Laien wir mich, wie eine Tabellensoftware aussieht. Die für mich ersichtliche Besonderheit ist, dass man auch grosse Datensätze relativ gut “am Stück” bearbeiten kann. So zum Beispiel via Facetten die Korrektur und Zusammenlegung der Sprachcodes oder auch das Herausfiltern von den verschiedenen Schreibweisen der (vermutlich) gleichen Autoren. Auch hier kann man eine Zusammenlegung ausführen. So weit meine Excel-Kenntnisse gehen, ist dies damit nicht möglich.
Eindrucksvoll war auch das Splitten von Spalten und die Einbindung von Wikidata. Allerdings beim Splitten war ich immer mehr auf verlorenem Terrain. Dass “split” für Splitten steht, wir das Komma in Klammern nehmen und dass das für eine Funktionsdefinition steht (in Python redeten wir von Tupel), die eckigen Klammern eine Auflistungsfunktion haben und “Null” für den ersten Wert steht (da das Zählen beim Programmieren bei 0 beginnt), konnte ich noch knapp nachvollziehen (Hallo Herr Weichselbraun!). Aber als es nachher um die Analyse von
ging, war ich auf verlorenem Posten.
=> Für diese Darstellung halfen mir weder die 4 Leersschläge noch der der Backtick, so kopierte ich diesesmal einfach einen Printscreen in mein Tagbuch.
Wie bereits im Unterricht erwähnt, hat es die Befehle split, escape, replace und slice. Aber was die genau auslösen konnte ich nicht mehr nachvollziehen.
Sicher ist ein solches Tool sehr brauchbar, um “messy data” aufzuräumen und vermutlich auch dringend nötig aber dazu bräuchte ich einen separaten Kurs und viele Übungsstunden.
Und dann waren die dreieinhalb Stunden bereits wieder vorbei…..