Direct naar inhoudDirect naar contactgegevens

Een schatkamer vol historische cijfers

Onderzoek en Statistiek viert dit jaar zijn 130ste verjaardag. Ter gelegenheid daarvan geven we de stad een cadeau: makkelijke en snelle toegang tot een groot deel van de cijfers die we in al die jaren hebben verzameld.

Op 10 oktober 1894 begon het Gemeentelijke Bureau van Statistiek met het verzamelen en publiceren van cijfers over Amsterdam. Een van de taken van het bureau was de uitgave van een Statistisch Jaarboek. Het eerste jaarboek bevatte cijfers over het jaar 1895. In 2019 verscheen het laatste jaarboek. Sindsdien publiceren we statistieken over de stad op deze website.

De 104 jaarboeken bevatten een schat aan informatie. Op basis van cijfers vertellen ze over de ontwikkeling van Amsterdam. De grote verhalen over de groei, afname en daarna weer onstuimige toename van de bevolking, de golfbewegingen van de economie en de perikelen op de woning- en arbeidsmarkt. Maar ook veel kleinere verhalen, bijvoorbeeld over de afname van besmettelijke ziekten, de introductie van de telefoon in Amsterdam en het aantal ongelukken door op hol geslagen paarden.

Ter gelegenheid van het 130-jarige jubileum openen we de deuren van onze schatkamer. De oude jaarboeken waren al beschikbaar als pdf-bestanden. Met behulp van kunstmatige intelligentie zijn de ruim 28 duizend pagina’s nu integraal doorzoekbaar.

Belangrijker: een toenemend deel van de cijfers is als digitale tabel beschikbaar en kan worden gedownload. Dat maakt het mogelijk om bijvoorbeeld nieuwe, langjarige tijdreeksen te maken. Ook kunnen historische ontwikkelingen nu makkelijk inzichtelijk gemaakt worden in kaarten en grafieken, bijvoorbeeld over het aantal vestigingen, de woningvoorraad en de bevolking.

We nodigen iedereen van harte uit gebruik te maken van de historische cijfers. En we zijn benieuwd naar de resultaten. Dus laat het ons weten via redactie.os@amsterdam.nl als je een scriptie, artikel, blog of visualisatie hebt gemaakt, dan kunnen we daarnaar verwijzen. Ook verzoeken om tabellen met voorrang digitaal beschikbaar te maken zijn welkom.

Amsterdam in cijfers

Niet alleen maken we de oude jaarboeken beter toegankelijk, we geven ze een ook een nieuw digitaal vervolg. Sinds 1982 was de titel van de jaarboeken Amsterdam in cijfers. De jaren daarna kregen de tabellen met cijfers steeds meer gezelschap van duidende tekst. Eerst een samenvatting van het geheel, daarna ook per thema. Die traditie zetten we voort op de website. In de loop van dit jaar publiceren we een reeks artikelen die per thema beschrijven hoe Amsterdam er statistisch voor staat: Bevolking in cijfers, Wonen in cijfers, Verkeer in cijfers en zo verder.

En de tabellen zelf? Die zijn tegenwoordig te vinden in een kleine honderd datasets. Waar mogelijk bevatten die cijfers van 2019 tot nu zodat ze samen met de jaarboeken een compleet overzicht bieden van 130 jaar Amsterdam in cijfers.

130-jaar-OenS-2.jpg

Hoe werkt het?

Om de jaarboeken doorzoekbaar en de tabellen digitaal beschikbaar te maken, hebben we de 104 pdf-bestanden eerst opgeknipt in losse pagina's en die in een database opgeslagen. Met behulp van Google Document AI zijn de teksten en cijfers gedigitaliseerd waarbij de tabelstructuur zoveel mogelijk behouden is gebleven. Na deze stap bevat de database meer dan 80 duizend tabellen.

Helaas is ook kunstmatige intelligentie niet feilloos. Veel tabellen bevatten foutjes, vooral als je verder teruggaat in de tijd. Voordat we een tabel beschikbaar maken, controleren we of de cijfers kloppen. Het aantal tabellen dat ook digitaal beschikbaar is, zal in de loop van de tijd toenemen. Als tabellen eenmaal gedigitaliseerd zijn, kunnen we ze gebruiken om tijdreeksen te maken met cijfers over een langere periode. Ook die tijdreeksen voegen we toe aan de database.

De pagina's, tabellen en tijdreeksen zijn te vinden en raadplegen via de link hiernaast. Hieronder leggen we uit hoe een en ander werkt.

In de historische jaarboeken staan termen die vroeger gangbaar waren maar die we nu niet meer gebruiken. Lees meer over de manier waarop Onderzoek en Statistiek omgaat met statistische termen en categorieën.