Ich bin vom Fach. Wenn ich sage, dass in der Datenbasis keine Namen, sondern nur IDs vorhanden sind, dann meine ich das nicht oberflächlich, sondern bis runter in jedes Datenfeld:
- [0] war am 18. abwesend, also muss die Zeile wo am 18. ein X steht zu [0] gehören.
- [1] hat dreimal seine Hausaufgaben vergessen, also muss die Zeile wo drei X bei Hausaufgaben vergessen gemacht wurden zu [1] gehören usw.
Für mich sieht es so aus, als würde es eine eindeutige Zuordnung Schüler-ID -> Schüler geben. Wenn man zusätzliche Informationen besitzt (Eltern über Söhne, Schüler über Mitschüler, das Klassenbuch...), dann kann man daraus Informationen rekonstruieren. Wenn man diese Informationen hat, ist das Prinzip beim "entschlüsseln" ähnlich wie bei der bekannten Einstein-Aufgabe (Wem gehört der Fisch?) zwar zeitaufwendig aber wie bei einem Puzzle lösbar. Im Datenschutzgesetz würde so etwas nach meiner Interpretation Pseudonomisierung genannt. Die Idee ist an sich gut und sichert die Daten schonmal gut ab gegen Personen, die keine zusätzlichen Informationen besitzen. Allerdings ist sie aufgrund der Unsicherheit gegenüber Schülern und Eltern nicht als einzige Sicherheitsmaßnahme zu gebrauchen.
Wenn die Daten aber eh als CSV-Datei auf der Platte liegen, spricht ja nichts dagegen, sie mit TrueCrypt o.ä. zusätzlich zu verschlüsseln. Dann ist man auf der sicheren Seite. (Überhaupt: Welches Argument spricht gegen Verschlüsselung?)
Man sollte nur nicht auf die Idee kommen, dass wenn man in einer Datenbank mit IDs anstatt Schülerdaten arbeitet automatisch
* keine personenbezogenen Daten mehr verarbeitet.
* automatisch ein sicheres System geschaffen hat.
Im Kommentar zum Datenschutzgesetz wird dies folgendermaßen formuliert:
"Ob pseudonyme Daten als personenbezogen, weil personenbeziehbar einzustufen sind, ist kontextbezogen festzustellen. Durch den Anfall von weiteren Daten kann sich im Zeitablauf eine Bestimmbarkeit ergeben."