Une approche individuelle et multidimensionnelle de la ségrégation

Antoine JARDIN
IR CNRS - CESDIP - www.antoinejardin.com

Etat des lieux

  • Nous disposons déja de nombreux travaux sur la ségrégation et la distribution spatiale des inégalités (Préteceille, Safi, Pan Ké Shon …)

  • Ces recherches reposent, dans la grande majorité des cas, sur des données agrégées, principalement à l'échelle des IRIS.

  • La tradition de recherche en analyse écologique des données sociales a longtemps éte marginalisée car sujette à l'erreur écologique (Robinson)

Améliorations ?

  • L'analyse écologique des données quantitatives a connu des évolutions techniques considérables depuis 15 ans.

  • “A solution to the ecological fallacy problem” - Gary King, Ori Rosen

  • “Not so much” - Lucas Leehman

  • Les progrès restent limités et demandent des techniques complexes (inférence bayésienne, tomographie, etc).

L'amélioration par l'usage de nouvelles données

  • On dispose aujourd'hui de données inédites de l'INSEE (Fichier Détail Recensement 2012)

  • Données individuelles , pondérées

  • Localisées à l'IRIS

  • On peut étudier les quartiers à partir de chacun des individus qui résident

  • En travaillant au niveau individuel puis en réagrégant les caractéristiques communes des quartiers, on échappe totalement au risque de l'analyse écologique.

L'erreur écologique et son issue

  • On ne déduit pas les relations statistiques au niveau individuel du niveau agrégé. Au contraire on les estime au niveau individuel pour les agréger ensuite.

  • On peut contrôler chacune des relations étudiées du niveau individuel à l'agrégé sans perte d'information.

  • La France est l'un des premiers pays, avec l'Espagne, à produire ce type de fichier à partir de son recensement.

  • Libre Accès (!) : CASD non nécessaire.

  • Un nombre de variables non négligeable mais qui reste relativement limité.

Données :

  • Fichier Détail INSEE en accès libre

  • Format txt ou dbf

  • 89 variables, 20 325 135 observations

  • Localisation IRIS, Canton-Ville, Département, Région

  • Exemple : 591 000 individus pour la Seine-Saint-Denis

Stratégie d'analyse :

  1. On réalise une ACM pondérées sur les variables d'intérêt. On obtient alors un nuage des individus.

  2. A partir du nuage des individus, on calcule les points moyens des IRIS à partir de leur composition en population. On aggrège le fichier à l'échelle des IRIS

  3. On calcule la dissimilarité entre les quartiers à partir de deux dimensions : leurs coordonnées sur les deux axes de l'ACM.

  4. Ces dimensions sont des représentations synthétiques des n dimensions d'analyses introduites par les n variables de l'ACM.

  5. On peut représenter graphiquement les résultats facilement, faire varier les échelles.

Les limites :

  • “Seulement” 89 variables

  • Pas encore de recul historique

  • Temps de calcul !!!

  • 1 heure minimum pour l'ACM sur un pc quadricore, 16 go de RAM et SSD

Résultats préliminaires :

Variables d'intérêt :

  • AGER20
  • CS1
  • DIPL
  • EMPL
  • IMMI
  • RECH
  • TACT

Les avantages techniques : syntaxe simple !

use “/home/me/RP2012_INDCVI_txt/recens12.dta”

mca AGER20 CS1 DIPL EMPL IMMI RECH TACT

mcaplot, overlay

graph export mca.png

predict ax1 ax2

collapse ax2 ax1 [iw=IPONDI], by(REGION DEPT CANTVILLE IRIS) fast

save “/home/me/toulouse.dta”, replace

use “/home/me/toulouse.dta”

rename *, lower

Variables : Age

  • 02 : Deux ans et moins
  • 05 : 3 à 5 ans
  • 10 : 6 à 10 ans
  • 14 : 11 à 14 ans
  • 17 : 15 à 17 ans
  • 19 : 18 à 19 ans
  • 24 : 20 à 24 ans
  • 29 : 25 à 29 ans
  • 39 : 30 à 39 ans
  • 54 : 40 à 54 ans
  • 64 : 55 à 64 ans
  • 79 : 65 à 79 ans
  • 80 : 80 ans ou plus

Variables : CS1

  • 1 : Agriculteurs exploitants
  • 2 : Artisans, commerçants et chefs d'entreprise
  • 3 : Cadres et professions intellectuelles supérieures
  • 4 : Professions Intermédiaires
  • 5 : Employés
  • 6 : Ouvriers
  • 7 : Retraités
  • 8 : Autres personnes sans activité professionnelle

Variables : Diplome

  • 01 : Pas de scolarité
  • 02 : Aucun diplôme mais scolarité jusqu'en école primaire ou au collège
  • 03 : Aucun diplôme mais scolarité au delà du collège
  • 11 : Certificat d'études primaires
  • 12 : BEPC, brevet élémentaire, brevet des collèges
  • 13 : Certificat d'aptitudes professionnelles, brevet de compagnon
  • 14 : Brevet d'études professionnelles
  • 15 : Baccalauréat général, brevet supérieur
  • 16 : Bac technologique ou professionnel, brevet professionnel ou de technicien, BEC, BEI, BEH, capacité en droit
  • 17 : Diplôme universitaire de 1er cycle, BTS, DUT, diplôme des professions sociales ou de santé, d'infirmier(ère)
  • 18 : Diplôme universitaire de 2ème ou 3ème cycle (y compris médecine, pharmacie, dentaire), diplôme d'ingénieur, d'une grande école, doctorat, etc.
  • ZZ : Sans objet (personne âgée de moins de 14 ans)

Variable : Condition d'emploi

  • 11 : En contrat d'apprentissage
  • 12 : Placés par une agence d'intérim
  • 13 : Emplois-jeunes, CES, contrats de qualification
  • 14 : Stagiaires rémunérés en entreprise
  • 15 : Autres emplois à durée limitée, CDD, contrat court, vacataire…
  • 16 : Emplois sans limite de durée, CDI, titulaire de la fonction publique
  • 21 : Non salariés : Indépendants
  • 22 : Non salariés : Employeurs
  • 23 : Non salariés : Aides familiaux
  • ZZ : Sans objet

Variables : Rapport à la recherche d'emploi

  • 0 : Ne recherche pas d'emploi
  • 1 : Cherche un emploi depuis moins d'un an
  • 2 : Cherche un emploi depuis plus d'un an
  • 9 : Non déclaré (inactif)
  • Z : Sans objet (en emploi)

Variables : Type d'activité

  • 11 : Actifs ayant un emploi, y compris sous apprentissage ou en stage rémunéré.
  • 12 : Chômeurs
  • 21 : Retraités ou préretraités
  • 22 : Elèves, étudiants, stagiaires non rémunéré de 14 ans ou plus
  • 23 : Moins de 14 ans
  • 24 : Femmes ou hommes au foyer
  • 25 : Autres inactifs

Variables : Immigration

  • 1 : Immigrés
  • 2 : Non immigrés

ACM :

trial

ACM :

trial

ACM :

trial

ACM :

trial

Cartes ? :

  • Pas encore, manque d'accès au shapefile des IRIS

Autres usages de la base :

  • Modélisation multiniveaux

  • Identification des effets spatiaux et contextuels

  • Identification des discriminations indirectes

Exemple descriptif simple :

trial

Exemple descriptif simple :

trial

Table ACM :

mca AGER20 CS1 DIPL EMPL IMMI RECH TACT

Multiple/Joint correspondence analysis         Number of obs      =  16280138
                                               Total inertia      =  .6445201
    Method: Burt/adjusted inertias             Number of axes     =         2

                |   principal               cumul 
      Dimension |    inertia     percent   percent
    ------------+----------------------------------
          dim 1 |    .3712378     57.60      57.60
          dim 2 |    .0877823     13.62      71.22
          dim 3 |    .0414058      6.42      77.64
          dim 4 |    .0183926      2.85      80.50
          dim 5 |    .0093771      1.45      81.95
          dim 6 |    .0066772      1.04      82.99
          dim 7 |    .0030318      0.47      83.46
          dim 8 |    .0016076      0.25      83.71
          dim 9 |    .0010276      0.16      83.87
         dim 10 |    .0005187      0.08      83.95
         dim 11 |    .0004273      0.07      84.01
         dim 12 |    .0003004      0.05      84.06
         dim 13 |    .0002494      0.04      84.10
         dim 14 |    .0001164      0.02      84.12
         dim 15 |    .0000614      0.01      84.13
         dim 16 |     .000015      0.00      84.13
         dim 17 |    2.56e-06      0.00      84.13
         dim 18 |    1.61e-06      0.00      84.13
         dim 19 |    3.75e-09      0.00      84.13
    ------------+----------------------------------
          Total |    .6445201    100.00

Statistics for column categories in standard normalization

                 |          overall          |        dimension_1        |        dimension_2        
      Categories |    mass  quality   %inert |   coord   sqcorr  contrib |   coord   sqcorr  contrib 
    -------------+---------------------------+---------------------------+---------------------------
    AGER20       |                           |                           |                           
              17 |   0.004    0.615    0.022 |   1.192    0.156    0.006 |   4.197    0.458    0.074 
              19 |   0.005    0.705    0.012 |   0.727    0.116    0.002 |   3.372    0.589    0.053 
              24 |   0.012    0.573    0.008 |  -0.171    0.025    0.000 |   1.652    0.548    0.032 
              29 |   0.012    0.812    0.006 |  -0.819    0.785    0.008 |   0.313    0.027    0.001 
              39 |   0.024    0.918    0.012 |  -0.912    0.917    0.020 |   0.051    0.001    0.000 
              54 |   0.036    0.889    0.017 |  -0.845    0.889    0.026 |  -0.020    0.000    0.000 
              64 |   0.022    0.684    0.003 |   0.331    0.419    0.002 |  -0.540    0.265    0.006 
              79 |   0.020    0.917    0.039 |   1.590    0.750    0.051 |  -1.544    0.167    0.048 
              80 |   0.009    0.910    0.021 |   1.708    0.760    0.028 |  -1.557    0.149    0.023 
    -------------+---------------------------+---------------------------+---------------------------
    CS1          |                           |                           |                           
               1 |   0.001    0.136    0.006 |  -1.049    0.120    0.001 |  -0.781    0.016    0.001 
               2 |   0.005    0.143    0.021 |  -1.006    0.133    0.005 |  -0.551    0.009    0.001 
               3 |   0.014    0.623    0.019 |  -1.178    0.592    0.019 |  -0.560    0.032    0.004 
               4 |   0.021    0.827    0.017 |  -1.082    0.820    0.024 |  -0.200    0.007    0.001 
               5 |   0.025    0.727    0.016 |  -0.907    0.722    0.020 |   0.148    0.005    0.001 
               6 |   0.019    0.531    0.014 |  -0.818    0.520    0.012 |   0.248    0.011    0.001 
               7 |   0.036    0.880    0.076 |   1.612    0.716    0.094 |  -1.588    0.164    0.092 
               8 |   0.023    0.731    0.053 |   1.022    0.262    0.024 |   2.812    0.469    0.182 
    -------------+---------------------------+---------------------------+---------------------------
    DIPL         |                           |                           |                           
              01 |   0.003    0.341    0.004 |   0.877    0.338    0.002 |   0.162    0.003    0.000 
              02 |   0.015    0.718    0.006 |   0.658    0.696    0.007 |  -0.237    0.021    0.001 
              03 |   0.006    0.575    0.001 |  -0.007    0.000    0.000 |   0.974    0.574    0.006 
              11 |   0.012    1.054    0.017 |   1.428    0.804    0.024 |  -1.637    0.250    0.031 
              12 |   0.011    0.640    0.009 |   0.646    0.291    0.005 |   1.454    0.349    0.023 
              13 |   0.018    0.187    0.002 |  -0.025    0.003    0.000 |  -0.431    0.184    0.003 
              14 |   0.012    0.695    0.002 |  -0.470    0.663    0.003 |   0.212    0.032    0.001 
              15 |   0.015    0.541    0.003 |   0.102    0.031    0.000 |   0.857    0.510    0.011 
              16 |   0.012    0.722    0.003 |  -0.510    0.684    0.003 |   0.248    0.038    0.001 
              17 |   0.018    0.727    0.006 |  -0.662    0.720    0.008 |  -0.130    0.007    0.000 
              18 |   0.021    0.466    0.013 |  -0.673    0.433    0.009 |  -0.386    0.034    0.003 
    -------------+---------------------------+---------------------------+---------------------------
    EMPL         |                           |                           |                           
              11 |   0.001    0.293    0.003 |  -0.849    0.209    0.001 |   1.105    0.084    0.002 
              12 |   0.001    0.434    0.002 |  -1.043    0.433    0.001 |   0.099    0.001    0.000 
              13 |   0.001    0.567    0.001 |  -1.006    0.566    0.001 |   0.083    0.001    0.000 
              14 |   0.000    0.347    0.001 |  -1.071    0.342    0.000 |   0.269    0.005    0.000 
              15 |   0.006    0.719    0.006 |  -1.078    0.718    0.008 |  -0.051    0.000    0.000 
              16 |   0.055    0.853    0.048 |  -1.121    0.834    0.069 |  -0.351    0.019    0.007 
              21 |   0.005    0.244    0.015 |  -1.099    0.221    0.006 |  -0.714    0.022    0.002 
              22 |   0.003    0.185    0.014 |  -1.121    0.166    0.004 |  -0.762    0.018    0.002 
              23 |   0.000    0.121    0.001 |  -1.015    0.110    0.000 |  -0.655    0.011    0.000 
              ZZ |   0.070    0.890    0.062 |   1.162    0.872    0.094 |   0.341    0.018    0.008 
    -------------+---------------------------+---------------------------+---------------------------
    IMMI         |                           |                           |                           
               1 |   0.017    0.089    0.004 |   0.005    0.000    0.000 |   0.403    0.089    0.003 
               2 |   0.126    0.089    0.001 |  -0.001    0.000    0.000 |  -0.053    0.089    0.000 
    -------------+---------------------------+---------------------------+---------------------------
    RECH         |                           |                           |                           
               0 |   0.046    0.898    0.059 |   1.407    0.898    0.091 |  -0.042    0.000    0.000 
               1 |   0.007    0.134    0.023 |  -0.051    0.000    0.000 |   1.858    0.134    0.023 
               2 |   0.005    0.106    0.018 |  -0.007    0.000    0.000 |   1.636    0.106    0.014 
               9 |   0.012    0.872    0.016 |   1.411    0.856    0.023 |   0.404    0.017    0.002 
               Z |   0.073    0.891    0.059 |  -1.105    0.873    0.090 |  -0.321    0.017    0.008 
    -------------+---------------------------+---------------------------+---------------------------
    TACT         |                           |                           |                           
              11 |   0.073    0.890    0.059 |  -1.108    0.872    0.090 |  -0.325    0.018    0.008 
              12 |   0.012    0.123    0.041 |  -0.042    0.000    0.000 |   1.771    0.123    0.037 
              21 |   0.036    0.880    0.076 |   1.612    0.716    0.094 |  -1.588    0.164    0.092 
              22 |   0.010    0.680    0.043 |   1.145    0.184    0.014 |   3.862    0.496    0.155 
              24 |   0.005    0.446    0.012 |   1.016    0.270    0.005 |   1.686    0.176    0.015 
              25 |   0.006    0.473    0.013 |   0.942    0.238    0.005 |   1.926    0.235    0.022 
    -------------------------------------------------------------------------------------------------