„Du kannst sie nicht haben, denn Du würdest sie nicht verstehen.“

Mit diesen Worten beschreibt Tim Berners-Lee in einem Interview das intensive Verhältnis von CIOs mit Daten, die ihre Unternehmen speichern. Er spricht dabei von Kontrollfreaks, welche ihre Datenbank verteidigen, als wäre sie eine geliebte Frau.

Als ich das Interview las, erinnerte ich mich an einen vor ein paar Wochen getätigten Telefonanruf. Damals habe ich in meinem Wohnkanton beim Amt für Verbraucherschutz angefragt, ob ich die Lebensmittelkontrollergebnisse der einzelnen Betriebe des letzten Jahres einsehen dürfe. Um es gleich vorwegzunehmen: ich durfte nicht. Natürlich hat mein Gesprächspartner rechtens gehandelt, schliesslich wäre dies (noch) illegal gewesen. Ich erzählte ihm, dass ich die Daten im Zusammenhang mit Thema OpenData  verwenden möchte und musste ihn dabei zuerst über die Bedeutung des Begriffs aufklären. Zwar hatte er bereits vom Berliner Smiley-System gehört, doch konnte er sich keinen Reim darauf machen, worin der Vorteil von öffentlich frei verfügbaren und nutzbaren Daten sein sollte. Er argumentierte unter anderem mit dem Verweis, dass man die Jahresberichte der Lebensmittelkontrolle als pdf`s herunterladen bzw. per Post zustellen lassen kann. Ausserdem liess er mich wissen, dass er keinen Sinn einer strukturierten und maschinenlesbaren Veröffentlichungsform sehe, in welcher sich die Daten filtern, durchsuchen und von anderen Anwendungen weiterverarbeiten lassen können. Zudem äusserte er seine Bedenken bezüglich der dadurch möglichen Medienhetze gegenüber den schlecht bewerteten Betrieben. Diese könnten allenfalls von der Kundschaft gemieden werden, was zu einer nachhaltigen Rufschädigung und zum Konkurs führen könnte. So musste ich mich zwangsläufig wieder von der Idee verabschieden, eine entsprechende Visualisierung über meinen Wohnbezirk zu erstellen.

Natürlich sind Vorbehalte gegenüber der Veröffentlichung von Lebensmittelkontroll- ergebnissen zu einem gewissen Grade gerechtfertigt, doch kennen wir solche bereits aus den Gründerjahren des Internets. Tim Berners-Lee erinnerte sich im eingangs erwähnten Interview an diese Zeit, als sich Firmen und Geschäfte mit eigenen Webseiten oft fragen lassen mussten, zu was das nützlich sein soll. Auch hätten viele Unternehmen Angst gehabt, z. B. durch die Veröffentlichung von Produktpreisen der Konkurrenz wertvolle Informationen zu überlassen. Doch habe sich schliesslich diese Offenheit als Wettbewerbsvorteil bei den Kunden herausgestellt, indem transparent handelnde Unternehmen bevorzugt wurden. Im Weiteren sagte Tim Berners-Lee zukunftsblickend voraus, dass im Hinblick auf OpenData der Wettbewerbsdruck Unternehmen und Regierungen zu mehr Transparenz zwingen werde. Dabei zeigt er durchaus Verständnis für die datenschutzrechtlichen Bedenken, sind doch die meisten der von Regierungsbehörden erhobenen Daten personenbezogen. In der Frage der Anonymisierung liege denn auch die Lösung der meisten Datenschutzprobleme.

Dass das Thema OpenData dem Interneterfinder Tim Berners-Lee am Herzen liegt, wurde in diesem Blog bereits früher aufgezeigt. Der umtriebige MIT-Professor, HTML-Erfinder und W3C-Vorsitzende wird zusammen mit Nigel Shadbolt, Professor für Künstliche Intelligenz an der Universität Southampton, das weltweit erste OpenData Institut (ODI) leiten, welches seine Tore im September dieses Jahres öffnen soll. Darin sollen sich OpenData-Interessierte im Umgang mit grossen Datenmengen üben und v. a. sollen Start-up-Unternehmer, die veröffentlichte Regierungsdaten nutzen, unterstützt und gefördert werden.

Ziele des OpenData Instituts

Zu hoffen ist, dass bei der Entwicklung zu OpenData dem Datenschutz einen genug grossen Stellenwert zugeschrieben wird. Schliesslich lässt sich Tim Berners-Lee folgendermassen zitieren: „… gespeicherte Daten sind wie Dynamit und beinhalten eine hohe Sprengkraft, wenn sie in die Hände von Kriminellen gelangen.“

Advertisements

Starke Communities als Grundlage zur Realisierung der „Open Government Data“-Strategien

Um die OpenData-Bewegung noch stärker ins Bewusstsein unserer Gesellschaft zu bringen, braucht es auch eine starke Community. Dadurch kann die Bewegung ihren Anliegen mehr Gewicht verleihen und sich Gehör verschaffen. Durch aktive Teilnahme am Thema können Anregungen und Verbesserungsmöglichkeiten geäussert werden, um das Ziel möglichst vieler öffentlicher und frei nutzbarer Daten voranzutreiben.
In der Schweiz macht sich dafür die OpenData-Community stark.
Bild Sie bietet neben einer offenen Mailingliste einen RSS Feed an. Zudem werden regelmässige Events (wie z. B. die Hackdays) organisiert, sodass der Kontakt und Kommunikationsfluss zwischen den OpenData-Interessierten optimiert werden kann. Im vergangenen Jahr ist es der Schweizer OpenData-Community erfolgreich gelungen, die Politik, Verwaltung und Medienlandschaft auf Open Government Data  aufmerksam zumachen.

Über die Wichtigkeit einer starken Community wurde auch am letztjährigen nationalen e-Gov-Symposium in Bern gesprochen. Zahlreiche  Referenten aus der Schweiz und Europa sprachen über ihre Erfahrungen in der elektronischen Verwaltung.
Dabei machte sich Peter Krantz, Vertreter der schwedischen E-Government-Delegation, dafür stark, die Community verstärkt in die Konzeption, Umsetzung von Strategien und Aktivitäten im Bereich von Open Government Data einzubinden.

Aber eine starke Community zu etablieren ist eine Herausforderung und verlangt viel Aufbauarbeit.

Eine internationale Community zu lancieren ist wahrscheinlich noch schwieriger. Umso spannender ist es, solche Bestrebungen zu verfolgen. Vom 24. – 25.04.2012 kamen Verantwortliche aus Österreich, Deutschland und der Schweiz zusammen, um sich am Verwaltungskongress „Effizienter Staat“  über die Möglichkeiten einer länderüber-greifende Zusammenarbeit in Sachen Open Government Data zu diskutieren.

Dabei wurden unter anderen folgende drei Ziele formuliert:

  1. „Die Förderung des Austausches und Dialoges zum Thema Open Government Data auf nationaler und übernationaler Ebene. Ziel ist der Aufbau und die Förderung einer Open-Government-Data-Community im D-A-CH-Verwaltungsraum.“
  2. „Die Vermarktung einer modernen Verwaltung inkl. Open Government Data als Standortfaktor.“
  3. „Die Förderung des Austausches zu Standards, Schnittstellen und Metadaten zwischen Deutschland, Österreich und der Schweiz.

Communities dienen dazu, um sich für ein Thema stark zu machen und eine starke Basis zu schaffen. Im Bereich Open Government Data sind sie von zentraler Bedeutung, um zwischen privaten Aktivisten und der öffentlichen Verwaltung als Bindeglied zu wirken. Denn wie sagte doch Andreas Amsler unlängst: „Ohne die aktive Ein­bin­dung der Zivil­ge­sell­schaft, also auch der OGD-Community, sind ihre Ver­spre­chen ein­lö­sende Open-Government- und OGD-Strategien schlicht nicht denk– und umsetz­bar.“

Bildquelle – Durch die regelmässig veranstalteten Hackdays wird die Community gestärkt.

Open Data – von unten nach oben

Nicht nur die Datenflut der Öffentlichkeit nimmt zu, auch meine persönlichen Daten und Dokumente vermehren sich scheinbar über Nacht. Mein digitaler Passwort-Tresor, der selbstverständlich zwischen Laptop und Smartphone synchronisiert wird, verfügt mittlerweile über 157 Einträge, und dies obwohl ich immer zweimal überlege, bevor ich irgendwo einen Account eröffne. Bekam ich früher Rechnungen per Post und legte sie nach der Zahlung in einem Ordner ab, der nach 10 Jahren ins Altpapier wanderte, bekomme ich heute solche Dokumente elektronisch und füge sie fein säuberlich in der wohldurchdachten Ordnerstruktur des Windows Explorers ein. Dieser hat inzwischen ein unglaubliches Ausmass angenommen. Das gleiche gilt für das Lesezeichenmenu meines Browsers. Es dauert schon seine Zeit, bis ich mich durch alle Hierarchieebenen bis zu  meinem Dokument respektive Link durchgehangelt habe. Glücklicherweise tragen diese Datemmengen digital im Gegensatz zum Papier nicht auf: Mein Laptop erreicht die Dicke eines Bundesordners nicht, auch wenn ich ihn noch so sehr mit Daten vollstopfe.

Ein Problem sind jedoch sensible Dokumente mit persönlichen Angaben. Konnte ich diese früher in einen Safe einschliessen, liegt heute alles in der Dropbox, damit ich auf allen meinen Computern und vom Web aus Zugriff darauf habe. Die Datenschutzprobleme von Dropbox und anderen Cloud-Speichern sind zwar hinlänglich bekannt, doch diese Dienste sind eben einfach praktisch. (mehr …)

Data Dealer und Gesundheitsdaten

Logo "Datadealer"

Trailer zum Spiel

Beim Vorbereiten der Lektion für die Mitstudierenden zum Thema Open Data vs. Datenschutz bin ich auf das Facebookspiel Data Dealer gestossen. Ein Team aus Wien hat dieses Game entwickelt und eine Demo-Version veröffentlicht, die im Browser spielbar ist. Das Spiel will ohne erhobenen Zeigefinger für das Thema Datenschutz mit seinen Problemfeldern sensibilisieren, in dem der Spieler die Perspektive eines Datenhändlers einnimmt. Eindrücklich war für mich vor allem, dass offenbar Krankenkassen daran interessiert sind, Gesundheitsdaten von potenziellen Kunden zu erhalten, um schlechte Risiken auszuschliessen.

Eine Horrorvorstellung! Kein Wunder, dass es mir kalt den Rücken hinunter lief, als ich das erste Mal vom OpenData-Projekt CIRRNET gehört habe. Bei der näheren Beschäftigung mit dem Thema habe ich mich jedoch wieder beruhigt. (mehr …)

Transparenz im Informationszeitalter

Vorletzte Woche führten meine Mitbloggerin und ich in der Lehrveranstaltung „Informationsgesellschaft, -Ethik, -Politik“ der HTW Chur eine Präsentation zum Thema OpenData vs. Datenschutz durch. Zum Einstieg stellten wir unseren Mitstudenten eine mit Google Docs erstellte Visualisierung über die Anzahl Arbeitslosen, Anzahl Betreibungen und der Bevölkerungszahl ihrer Wohnorte vor. Dadurch konnten wird den mehrheitlich synchronen Verlauf zwischen den Arbeitslosen- und Betreibungsdaten aufzeigen und somit ein Beispiel aufführen, was mit Open E-Government auf einfache Weise erstellt werden könnte. Da uns die Daten nicht online, in elektronischer und maschinenlesbarer Form vorlagen, mussten wir verschiedene behördliche Ämter anfragen, ob sie uns die Daten zukommen lassen könnten. Wären uns entsprechende Open E-Government-Plattformen zur Verfügung gestanden, hätten wir einen ungleich kleineren Aufwand betreiben müssen. Diese Nicht-Offenlegung der Regierungs- und Verwaltungsdaten erstaunt insofern, als dass sich das Internet sehr gut eignet, um Informationen einfach und transparent zugänglich zu machen. Dies ermöglicht nicht zuletzt Kosteneinsparungen für die Behörden, da weniger individuelle Bürgeranfragen beantwortet werden müssen.

Wie im zuletzt geschriebenen Blogbeitrag „Die Macht von Visualisierungen“ bereits dargestellt, reicht es nicht aus, Datenbanken ins Netz zu stellen. Ein wichtiger Faktor für den Erfolg von Datenpublikationen ist neben einer attraktiven Aufbereitungsmöglichkeit auch die Verständlichkeit der Daten und der Zugang zu anderen Datenquellen, um diese miteinander in Beziehung zu setzen. Dies kann beispielsweise mit Hilfe von technischen Schnittstellen erreicht werden. In diesem Zusammenhang bin ich in einem auf NYCFacets aufgeschalteten Webfilm [ab 1:36 Min.] auf folgendes Zitat gestossen:

„Because it`s so much more than just having access to the data. It`s also about understanding each data set and how do they pleach other and to other data sources outside the catalogue.”

Image

NYCFacets ist eine „Smart Open Data Exchange“-Plattform für alle öffentlichkeits- relevanten Daten von New York City. Dadurch will sich der Big Apple als Digital City of the Future etablieren.

In einem ersten Schritt wurden möglichst viele Datensätze New Yorks im NYC OpenData-Portal aufbereitet. Als nächstes sollen nun weitere NYC-relevante Datensätze katalogisiert und zueinander in Beziehung gesetzt werden, sodass dereinst allen Interessierten ein umfassender Metakatolog mit den spannendsten Daten über New York zur Verfügung stehen wird. Dieser wird es dem Benutzer ermöglichen, Datenquellen einfach zu finden, zu verknüpfen und in Anwendungen einzubinden.

Die primären Zielgruppen dieses Portals sind „Entwickler, die versuchen, den NYC OpenData Katalog zu verwenden“ und „NYC OpenData Veröffentlicher“, z. B. die Stadtverwaltung. Die sekundären Zielgruppen sind „NYC OpenData Recherchierer“, z. B. Journalisten und die allgemeine Öffentlichkeit.

Im letzten Jahr wurde auf diesem Portal auch der sogenannte BigApps3.0 Contest lanciert, bei welchem Entwickler dazu aufgerufen wurden, auf Basis der NYC OpenData möglichst kreative und originelle Apps zu erstellen. Dem Wettbewerb lag also ein Open Development-Ansatz zugrunde, durch welchen die Stadtverwaltung transparenter gemacht werden sollte. Die Gewinner erhielten Preise in der Höhe von insgesamt 50`000 $. Gewonnen hat unter anderem die NYTripBuilder.com-Website. Dort kann man sich einen persönlichen Reiseplan erstellen, um in einem bestimmten Zeitfenster die interessantesten Orte New Yorks zu erkunden.

Ich glaube, dass die OpenData-Bewegung durch solche innovative Ideen und Portale noch stärker ins Bewusstsein unserer Gesellschaft dringen kann, sodass ihr dadurch der erwünschte Erfolg zuteil wird.

Bildquelle – PrintScreen des auf NYCFacets aufgeschalteten Webfilms.

Die Macht von Visualisierungen

Der Eidgenössische Datenschutz- und Öffentlichkeitsbeauftrage möchte aus Gründen des Personenschutzes den gläsernen Menschen verhindern.  Im Gegensatz zu mancher Meinung, verfolgt auch die Open Data Bewegung nicht dieses Ziel. Vielmehr will sie diejenigen Daten frei nutzbar machen, welche im Interesse der Gesellschaft stehen. Ein wichtiger Aspekt dabei ist die Art und Weise der Aufbereitung, d. h. der Visualisierung. „Nackte Daten“ sind wenig interessant. Sobald man sie jedoch zueinander in Beziehung setzt und visualisiert, können sie an Aussagekraft gewinnen und sprechen mehr Leute an.

Im Internet gibt es heutzutage eine grosse Anzahl an brauchbaren Visualisierungstools. Zu nennen sind dabei bspw. Google fusion tables, Google spreadsheet charts, Open Heat Map, Tableau Public, Datamarket, Many Eyes, Color Brewer, batchgeo oder Chartsbin. Im Allgemeinen sind mir dabei folgende Punkte aufgefallen:

  1. Die Visualisierungssoftwares werden fast ausschliesslich in englischer Sprache angeboten.
  2. Für die angelsächsischen Länder können detailgetreuere und aussagekräftigere Kartenvisualisierungen erstellt werden als vom Rest der Welt.
  3. Es bedarf einiger Zeit, um sich mit den Programmen zurechtzufinden und diese gewinnbringend nutzen zu können.

Durch Visualisierungen können aus Daten Zusammenhänge geschaffen oder Erkenntnisse gewonnen werden, welche aus einem nicht aufbereiteten Datenpool nie herausgelesen werden könnten – dafür haben wir zu wenig Abstraktionsfähigkeit.

Bild

              Hans Rosling, bekannter Datenvisualist, bei einer seiner Präsentationen.

Visualisierungen eröffnen aber oftmals auch grossen Interpretationsspielraum. Bei Datenzusammenführungen muss man sich deshalb fragen, ob dadurch nicht falsche oder irreführende Zusammenhänge erstellt werden. Um der Gefahr des unreflektierten Glaubens entgegenzuwirken, ist es daher unabdingbar, Visualisierungen kritisch zu hinterfragen. Schliesslich können Visualisierungen auch ganz einfach nichtssagend sein. Im Datenjournalismus werden täglich unzählige davon erstellt, wobei gemäss Aron Pilhofer, Editor of Interactive News der «New York Times», meint, dass diese nicht immer klug eingesetzt würden: „Es gibt heute eine Menge schlechter Visualisierungen – ich nenne das Datenpornografie“.

Um einige Visualisierungen im Zusammenhang mit Open Data anzuschauen, verweise ich an dieser Stelle an den Verein Opendata.ch. Dieser organisierte vor 3 Wochen die 2. Schwei­zer Make.opendata.ch-Hackdays in Zürich und Genf. Dabei erstellten die teilnehmenden Personen mittels gut­ar­ti­gen “Hacks” Anwendungen und Visua­li­sie­run­gen mit Daten des öffent­li­chen Ver­kehrs. Es wurden einige spannende Projekte realisiert, welche sich in einer Auflistung von weiteren spannenden Visualisierungen einreihen.

Stephen King, Opfer des sozialen Dilemmas

Das Thema Kosten von Open Data lässt mich noch nicht los. Jedermann, meine Person eingeschlossen, liebt es, Informationen kostenlos im WWW zu erhalten. Die Inhalte eines Buches können wir in einer Buchhandlung überprüfen, eine Musik-CD probehören, bevor wir sie erwerben. Inhalte eines Bezahldienstes im Internet verkaufen uns jedoch die Katze im Sack. Was, wenn uns die Information gar nicht so dient, wie wir uns das vorstellen? Für Informationen kann es ja kein Rückgaberecht geben. Also bleibt es dabei: am liebsten haben wir unsere benötigte Information sofort und gratis und franko. (mehr …)

Kein Wasseranschluss für Schwarze in Ohio/USA

Firmen und Staaten sammeln immer mehr Daten ihrer Kunden bzw. ihrer Bürger. Was sich für die einen als lukratives Geschäft offenbart, verängstigt andere wegen der Preisgabe persönlicher Interessen und Verbindungen.

So sammeln aktuelle Social-Media Plattformen wie Facebook, Twitter, LinkedIn, Google + – mit insgesamt über 1`250`000`000 Mitgliedern – persönliche Daten, welche bspw. für Werbung und Meinungsforschung verwendet werden können.

Staaten tun es den Firmen gleich, indem sie ebenfalls Daten über ihre Bürger sammeln. Während in der Schweiz bereits in den späten 1980er Jahren bekannt wurde, dass Bundes- und kantonale Polizeibehörden über mehr als 700`000 Personen und Organisationen Fichen angelegt haben, stellt sich auch heutzutage die Frage, was mit den aktuellen Daten gemacht wird bzw. werden kann. Der mit diesem Thema sensibilisierte Bürger muss sich in diesem Zusammenhang die Frage stellen, wie er die preisgegebenen Daten zurückholen kann, um sie für die Gesellschaft nutzbar zu machen. Eine Möglichkeit liegt in der Idee der Open Data.  Diese Bewegung will Daten öffentlich frei verfügbar und nutzbar machen und somit ein Fundament legen, um demokratische Kontrolle zuzulassen, die Bürger verstärkt an polititschen Entscheiden partizipieren zu lassen und (die von den Behörden sowieso erhobenen) Daten zur freien Nachnutzung zur Verfügung zu stellen. Laut Wikipedia zielt die Open Data-Bewegung darauf ab, durch die Abwesenheit von Copyright, Patenten oder anderen proprietären Rechten vorteilhafte Entwicklungen auszulösen. Open Data können amtliche Daten (z. B. Verteilung von Agrarsubventionen), Daten staatlicher Stellen (z. B. Vermessungsämter), Daten aus öffentlich geförderter Forschung, Daten aus Graswurzel-Initiativen (z. B. Oben Street Map), Open Linked Data u.s.w. sein.

Es stellt sich die Frage nach den Möglichkeiten dieser neuen Transparenzmachung, der informationellen Selbstbestimmung und wo die Grenze zum Datenschutz verläuft.

Tim Berners-Lee zeigte bereits vor zwei Jahren, was sich alles mit Open Data herausfinden lässt. Beispielsweise den Zusammenhang zwischen einem Wasseranschluss im Haushalt und der Hautfarbe der Hausbewohner.

Wir wollen in diesem Blog in den nächsten Wochen auf die Möglichkeiten der Open Data-Bewegung eingehen und gleichzeitig das eng verbundene Thema des Datenschutzes miteinbeziehen.