Stefan Ziller

GRÜN für Marzahn, Biesdorf, Kaulsdorf, Mahlsdorf und Hellersdorf

Netzpolitik & Digitalisierung Open Data Open Source Verwaltung 

Nutzungszahlen des Berliner Datenportals

Seit 2019 erhebt das Berliner Datenportal Nutzungszahlen. Sie zeigen einen kontinuierlichen Zugriff auf das Portal. Die Senatsverwaltung für Stadtentwicklung und Wohnen sowie Senatsverwaltung für Umwelt, Verkehr und Klimaschutz veröffentlichen dabei die meisten Datensätze. Die meistaufgerufenen Kategorien sind Geographie und Stadtplanung sowie Gesundheit. Eine aktuelle schriftlichen Anfrage (19/13752) zeigt Einzelheiten der Nutzung.

Was als Erstes auffällt, auch diese Nutzungszahlen sind offene Daten. Ein Github Repository macht die weitere zur Nutzung dann einfach – sehr gut!

Was als Zweites auffällt, ist dass die Nutzungszahlen mit 5000 bis 10.000 (Zahl der Seitenabrufe) über die Jahre konstant sind. Open Data in Berlin hat damit noch einiges an Potential. Dazu gehört auch ein Kulturwandel in der Verwaltung. Denn auch diese kann von offenen Daten profitieren durch das Aufbrechen von Informationssilos.
Grafische Darstellung von Nutzungsstatistiken des Datenportals Berlin.

Nutzungszahlen des Datenportals

Seit 2019 werden die Nutzungszahlen erhoben, zwischendurch gab es einen Wechsel in der Erhebungssoftware, Abweichungen durch die Methode wurden angepasst. Außerdem wurden die Daten von automatischen Zugriffen wie z.B. Bots und ähnlicher Software bereinigt (eine Bereinigung um 100 % kann dabei nicht garantiert werden).

Kurz zur Methode: Visits sind Seitenaufrufe einer Person, Impressions sind Anzahl der Interaktionen. Aus den Daten können wir schließen, wenn auf das Datenportal zugegriffen wird, gibt es auch Interaktion, sprich es werden verschiedene Daten aufgerufen und nicht nur kurz auf die Website geklickt. Die meisten Zugriffe gab es im Oktober 2020 mit 17580 Besuchen, dicht gefolgt von 17007 im Mai 2019, allerdings gab es im Oktober 2010 sehr viel mehr und langanhaltende Interaktionen.

Auf welche Kategorien wird zugegriffen?

Auf die folgenden Kategorien wird über hundertmal im Monat (2019 bis 2022) zugegriffen:

  • Geographie und Stadtplanung
  • Verkehr
  • Demographie
  • Öffentliche Verwaltung Haushalt und Steuern
  • Umwelt und Klima
  • Wohnen und Immobilien
  • Wahlen (2019)
  • Bildung
  • Protokolle und Beschlüsse
  • Arbeitsmarkt
  • Gesundheit

Die Zugriffe per Kategorien zeigen wie breit gefächert das öffentliche Interesse an Daten, welche die Verwaltung produziert und bereitstellt, sind. Es lassen sich auch Trends erkennen. Vor 2020 war Geographie und Stadtplanung mit teilweise 450 Zugriffen im Monat am stärksten gefragt, nach Verkehr (Spitze von 294 Zugriffen). Zur Europawahl 2019 stieg der Zugriff auf die Kategorie Wahlen auf bis zu 441 Zugriffe an. Den traurigen Rekord hält jedoch die Kategorie Gesundheit, mit 2436 Zugriffen in einem Monat im Jahr 2021. Dies ist mit Sicherheit auf die anhaltende Coronapandemie zurückzuführen.

Neue Datensätze

Das Datenportal in Berlin ist 2016 mit 860 Datensätzen gestartet, wuchs bis 2017 auf 1547 Datensätze an und hat heute 2964 Datensätze. Leider wird die Anzahl nur Stichprobenartig erfasst. Am 04.11.2022 haben die folgenden zehn Senatsverwaltungen, Sonderbehörden und Bezirke die meisten Datensätze online gestellt:

  • 831 – Senatsverwaltung für Stadtentwicklung und Wohnen
  • 637 – Senatsverwaltung für Umwelt, Verkehr und Klimaschutz
  • 333 – Senatsverwaltung für Gesundheit und Soziales
  • 310 – Stromnetz Berlin GmbH
  • 228 – Amt für Statistik Berlin-Brandenburg
  • 174 – Senatsverwaltung für Gesundheit, Pflege und Gleichstellung
  • 97 – Senatsverwaltung für Wirtschaft, Energie und Betriebe
  • 21 – Senatsverwaltung für Finanzen
  • 13 – Landesamt für Bürger- und Ordnungsangelegenheiten
  • 23 – Bezirksamt Friedrichshain-Kreuzberg

Besonders die letzten Daten enthalten einige Fehler. Die jeweiligen Verwaltungen, Sonderbehörden und Bezirke werden nicht einheitlich erfasst im Datenportal. So gab es vom Bezirksamt Friedrichshain-Kreuzberg zwei verschiedene Einträge, eines mit dem Zusatz “Vermessung”. Ein Problem, welches in vielen Datenportalen vorkommt und auf eine fehlende Standardisierung der Kategorien zurückzuführen ist. Diese fehlende Standardisierung tritt auch bei Betitelung, Verschlagwortung und Beschreibung von Daten auf. Wer sich mehr dafür interessiert, welche Probleme Datenportale haben, dem möchte ich den 20-minütigen Vortrag von Prof. Sebastian Meier (Fachhochschule Potsdam) auf dem City Lab Sommerfest 2022 empfehlen. Dieses Problem wird, soll im Jahre 2023 gelöst werden durch die Einführung einen Musterdatenkatalog.

1. Wie viele Seitenabrufe – ohne Zugriffe durch automatisierte Software, z.B. Robots und Spiders – hat es von 2016 bis 2022 pro Monat im Berliner Datenportal gegeben (Darstellung bitte nach Jahr, Monat und Zahl der Seitenabrufe)?

Im Berliner Datenportal hat es von 2016 bis 2022 pro Monat folgende Zahl an Seitenabrufen/Visits gegeben. Ein Ausschluss von Robots und Spidern kann nicht zu 100% garantiert werden. Bei der Betrachtung der Zahlen über den gesamten Zeitraum hinweg ist anzumerken, dass der Betreiber des Berliner Datenportals BerlinOnline zur Jahreswende 2019/2020 die Statistik Software von „boss“ zu „mapp/Webtrekk“ gewechselt hat. Die neue Software (mapp/Webtrekk) zählt grundsätzlich niedrigere Werte als die alte (boss). Um die Zahlen vergleichbar zu machen, wurden daher die Zahlen des alten Systems (boss) um einen Faktor von 1,67 nach unten korrigiert) Die Daten sind ebenfalls als Open Data veröffentlicht: https://berlinonline.github.io/berlin_dataportal_usage (Tabellarische Darstellung nach Jahr, Monat und Zahl der Seitenabrufe).

2. Wie oft wurden die Seiten der Datenkategorien des Berliner Datenportals von 2016 bis 2022 pro Monat besucht (Darstellung bitte nach Jahr, Monat, Datenkategorie und Zahl der Seitenabrufe)?

Die Seiten der Datenkategorien des Berliner Datenportals wurden von 2019 bis 2022 pro Monat mit folgender Seitenabrufzahl besucht. Die folgenden Daten können nur ab 2019 geliefert werden. Die Angaben beziehen sich auf die Übersichtsseiten der inhaltlichen Kategorien, also z.B. https://daten.berlin.de/kategorie/arbeitsmarkt. [Rohdaten in der Anfrage 19/13752]

3. Wie viele Datensätze oder Dokumente sind von 2016 bis 2022 pro Monat (beispielsweise zum Monatsanfang oder -ende) im Berliner Datenportal eingebunden gewesen (Darstellung bitte nach Jahr, Monat und Zahl der Datensätze)?

Im Berliner Datenportal wurde von 2016 bis 2022 pro Monat folgende Zahl an Datensätzen eingebunden. (Tabellarische Darstellung nach Jahr, Monat und Zahl der Datensätze. Die Gesamtzahl der Datensätze wird in unregelmäßigen Abständen erhoben, weshalb präzise Angaben zu jedem Monatsanfang oder -ende nicht möglich sind.) [Rohdaten in der Anfrage 19/13752]

4. Wie viele Datensätze oder Dokumente sind von aktuell (zu einem angegebenen Stichtag im Jahr 2022) pro Veröffentlichende Stelle im Berliner Datenportal eingebunden gewesen (Darstellung bitte nach Veröffentlichende Stelle Zahl der Datensätze)?

Zum Stichtag 04.11.2022 wurden von den unten aufgeführten veröffentlichenden Stellen auf dem Berliner Datenportal die jeweilige Zahl an Datensätzen veröffentlicht. Das Attribut zur Kennzeichnung der veröffentlichenden Stelle wird im Berliner Datenportal über ein Freitextfeld erfasst. Daher gibt es evtl. Doppellungen derselben Behörde durch unterschiedliche Schreibweisen. Die Daten sind dahingehend nicht bereinigt worden. [Rohdaten in der Anfrage 19/13752]

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Durch die weitere Nutzung der Website stimmen Sie der Verwendung von Cookies zu. weitere Informationen

Die Cookie-Einstellungen auf dieser Website sind auf "Cookies zulassen" eingestellt, um das beste Surferlebnis zu ermöglichen. Wenn du diese Website ohne Änderung der Cookie-Einstellungen verwendest oder auf "Akzeptieren" klickst, erklärst du sich damit einverstanden.

Schließen