1960

De volkstelling van 1960


De volkstelling van 1960 was de eerste telling die door het CBS met behulp van computers is verwerkt. Iedere getelde persoon vormde één ponskaart in het bestand van in totaal ca. 11,5 miljoen ponskaarten. Toen de Volkstelling van 1971 werd voorbereid, was er opslagruimte nodig voor de nieuwe telkaarten.
Inmiddels was in 1964 de Steinmetz-stichting opgericht. Deze stichting ijverde voor de oprichting van een wetenschappelijk data-instituut, dat computerbestanden ten behoeve van sociaal-wetenschappelijk onderzoek zou archiveren en ter beschikking stellen. Vanaf 1967 correspondeerden de Steinmetz-stichting (voorzitter H. ‘t Hart) en CBS (Directeur-Generaal J.Ch.W. Verstege) over de ponskaartenverzamelingen van CBS (vanaf ca. 1935; de ponskaarten van vóór 1960 werden met behulp van zogenaamde Hollerith-machines verwerkt).
In 1969 vond de overdracht van de ponskaarten van de Volkstelling 1960 (11,5 miljoen ponskaarten) aan de Steinmetz-stichting plaats. De overdracht zelf was al een logistieke operatie van aanzienlijke omvang. De Steinmetz-stichting was toen in afwachting van subsidie van de Ministeries van Onderwijs & Wetenschappen en Economische Zaken voor de oprichting van het data-instituut en had vrijwel geen financiële middelen. Voor transport en tijdelijke opslag van de ponskaarten was naar schatting al f. 12.600,- vereist, waarvoor een subsidie was aangevraagd bij de Universiteit van Amsterdam.

 
De bestanden nu en de verwerking sinds 1991


De volkstelling van 1960 werd uiteindelijk studienummer P0061 in het Steinmetz-archief. In de jaren zeventig zijn de dozen met ponskaarten, na geruime tijd opgeslagen te zijn geweest, opnieuw ingelezen en op magneetband gezet. Helaas is gebleken dat het toen opnieuw gecreëerde bestand een aantal gebreken vertoont.
De bestanden zijn in november 1991 door het Steinmetz-archief van zes of zeven magneetbanden van de CDC-Cyber mainframe computer overgezet naar een UNIX-computer. Bij deze conversie zijn enkele onregelmatigheden in de data waargenomen.
De oudste nu bestaande versies van de bestanden (aanwezig op CD-ROM in het Steinmetz-archief) dateren van 19 oktober 1994. De data zijn beschikbaar in de vorm van zeven bestanden met onbewerkte data. Deze bestanden bevatten de data in hun meest oorspronkelijke vorm (als afspiegeling van de ponskaarten in ASCII-formaat).

 
Cleaning van de data en het maken van SPSS-bestanden


In 1995 zijn de ruwe ASCII-bestanden door het Steinmetz-archief omgezet naar SPSS-systeembestanden. Volgens de beschikbare documentatie (bestand p0061_1.doc op de CD-ROM) is bij deze omzetting een beperkte vorm van datacleaning toegepast. Ernstig vervuilde records zijn terzijde gelegd en niet in de SPSS-bestanden opgenomen. Als ernstig vervuild zijn ondermeer aangemerkt alle records waarin zogenaamde dubbelponsingen voorkomen (met uitzondering van waar dat was toegestaan volgens de documentatie). Hierbij zijn ongeveer 3600 records 'vervuilde' records uit de bestanden verwijderd, die overigens in afzonderlijke restbestanden zijn opgeslagen.
Bij het maken van de SPSS-bestanden zijn ook variabelen gehercodeerd en zijn zij (evenals een groot aantal gecodeerde waarden) van 'labels' voorzien, zodat het werken met de gegevens werd vergemakkelijkt.

Eén van de uitgevoerde controles was op het voorkomen van zogenaamde wildcodes. Dit zijn codes die niet zijn gedocumenteerd en die dus niet zouden mogen voorkomen.

In het document p0061_2.doc wordt ter afronding van de bewerkingen gemeld: 'Gebruikers van deze studie dienen rekening te houden met een zekere mate van onvolledigheid van de data. Op basis van een vergelijking met de gepubliceerde aantallen mannen en vrouwen per gemeente, heeft het Steinmetz-archief geconstateerd dat sommige gemeenten in de databestanden geheel ontbreken, voor andere gemeenten alle personen van een bepaald geslacht ontbreken, voor andere gemeenten juist veel te veel personen van een bepaald geslacht voorkomen. Voor veel gemeenten zijn kleine en soms grotere verschillen geconstateerd tussen de gepubliceerde aantallen en de aantallen in de databestanden. De volledige resulaten van deze vergelijking zijn bij het Steinmetz-archief beschikbaar.'

 

Ontbrekende en dubbele informatie


Van 24 gemeenten, verspreid over de provincies Gelderland, Noord-Brabant, Noord- en Zuid-Holland ontbreken alle gegevens. Voorts ontbreken van drie gemeenten in Drenthe, Overijssel en Noord-Holland alle vrouwen.

Bij veel gemeenten zijn er grotere of kleinere afwijkingen in de aantallen mannen en vrouwen (van de bestanden ten opzichte van de gepubliceerde gegevens). Opvallend bij de vergelijking is, dat er een grote spreiding in de afwijkingen aanwezig is. Er zijn zowel gemeenten waarin slechts enkele of tientallen records ontbreken, als gemeenten met duizenden ontbrekende records.
Nog opmerkelijker is het voorkomen van gemeenten met meer records in het bestand dan in de publicaties. Zo zijn er 224.131 teveel mannen in Den Haag (tegenover 12.295 te weinig vrouwen. Bovendien heeft de provincie Zuid-Holland juist het grootste aantal missende gemeenten (namelijk 14, waaronder Dordrecht, Delft en Gorinchem). Ook Den Bosch telt maar liefst 18.834 te veel mannen.

Er zijn duidelijke aanwijzingen dat een deel van de ponskaarten niet en een deel dubbel is ingelezen. Er is ook informatie in de bestanden terechtgekomen die er niet in thuishoort, waarbij ook data is overschreven (zie ook: documentatiebestand p006101.doc op CD-ROM).

Om de data nader te analyseren zijn SPSS-bestanden aangemaakt (tussen eind 1995 en 22 januari 1996). In mei 1996 is nog een vergelijking gemaakt van de bevolkingsaantallen per gemeente in de bestanden met die in de CBS-publicaties. Hiervan is een beknopt verslag beschikbaar (document P006104.doc op CD-ROM).

 
Controles en bewerkingen sinds zomer 2002


In de zomer van 2002 is bestudeerd of de gehanteerde criteria niet hebben geleid tot het ongebruikt laten van te veel records. Dit heeft tot nu toe het volgende opgeleverd:
  • In één van de bestanden bevond zich midden tussen de data-records van Den Bosch een Fortran-programma van de geograaf Rinus Deurloo. Met hem is contact opgenomen over de mogelijke verklaring hiervan. Mogelijk is zijn 'job' tussendoor ingelezen zonder dat er End-Of-File kaarten zijn geplaatst, zodat het hele programma als data is geïnterpreteerd. Dit is waarschijnlijk al gebeurd tijdens het inlezen van de ponskaarten in de jaren zeventig.
  • Er zijn in de restbestanden ca. 3000 records gevonden, waarvan slechts één of enkele karakters onjuist lijken te zijn. Het lijkt erop alsof hier enkele bits zijn veranderd, mogelijk ten gevolge van lees- of schrijffouten op de tapes. Er kan ook sprake zijn van ponsfouten uit de tijd dat de bestanden zijn ingevoerd. In een aantal gevallen is aan de hand van de omliggende records in de oorspronkelijke bestanden (1991-1994) met grote waarschijnlijkheid af te leiden wat de foutieve waarde moet zijn. Echter, de mogelijke reconstructie van ca. 3000 records biedt bij lange na geen soelaas voor alle geconstateerde gebreken en afwijkingen.
  • Er is een aantal records gevonden, waarvan de eerste posities datarecords lijken te zijn en de laatste programmacode.
In een meer uitvoerig verslag in het Engels wordt de stand van zaken van het databestand van de volkstelling 1960 beschreven en worden aanbevelingen gedaan voor de "digitale restauratie" en toegankelijkheid van de gegevens.
Over de gemeenten met ontbrekende en veel missende personen zijn gegevens ingevoerd uit handgeschreven basistabellen, die in het archief en de bibliotheek van het CBS bewaard zijn gebleven.

LET OP: De individuele data van de volkstelling 1960 zijn onder voorwaarden te raadplegen. Belangstellenden kunnen zich wenden tot het Centrum voor Beleidsstatistiek (CvB) van het CBS. Voor meer informatie over de On Site toegang tot de databestanden van de Volkstelling van 1960, klik hier.
Daarnaast is het mogelijk een public use versie van de microdata via DANS aan te vragen. Voor meer informatie over de public use microdata bestanden, klik hier.

 
Beroepenclassificatie


De beroepenclassificatie behorende bij de volkstelling 1960 is niet in zijn geheel digitaal beschikbaar. Het NIWI heeft een deel van de classificatie gescand, maar vanwege tegenvallende resultaten is dit nooit afgerond. Hieronder vindt u vier zip-bestanden met daarin de images van de scans en gedeeltelijk ook de ge-OCR-de tekst uit die images.
 
Beroepenclassificatie 1/4 [application/x-zip-compressed] (4 MB)
Beroepenclassificatie 2/4 [application/x-zip-compressed] (2 MB)
Beroepenclassificatie 3/4 [application/x-zip-compressed] (2023 KB)
Beroepenclassificatie 4/4 [application/x-zip-compressed] (762 KB)


Last modified: 06-07-2006 15:24