Suite

Découpage des données des blocs de recensement dans une zone d'étude

Découpage des données des blocs de recensement dans une zone d'étude


J'essaie de découper les données des îlots de recensement dans une zone d'étude. J'ai un polygone de zone d'étude (fait à partir de la sélection de comtés entiers d'intérêt) et j'ai découpé les données du recensement par cela. Lorsque j'ai visité le nouveau fichier de recensement, j'ai découvert que ce processus avait créé des « éclats » à partir de l'ensemble de données de recensement d'origine qui sont très petits (la superficie est inférieure à un mile) mais sa population se compte par milliers ; toute la population du bloc d'origine a été à l'étroit dans cette zone minuscule. J'avais pensé que le découpage des données par l'étude aurait été un succès car les groupes de blocs, du moins à ma connaissance, ne traversent pas les comtés. Existe-t-il un moyen de supprimer facilement ces éclats superflus ou un meilleur moyen de découper les données du recensement dans une zone d'étude ?


Le problème est probablement que les limites de votre comté et vos blocs de recensement ne sont pas identiques et ne s'alignent pas correctement, vous laissant avec des éclats. Au lieu de couper, vous pouvez simplement rechercher les comtés que vous souhaitez utiliser, dans la zone d'étude, en utilisant le champ "COUNTYCU" dans la table attributaire. Ce champ donne un identifiant unique à chaque comté. L'utilisation de cet identifiant garantirait que vous utilisez des blocs qui se trouvent uniquement dans votre zone d'étude.


Une analyse Google Street View de la gentrification : une étude de cas d'un secteur de recensement à Northside, Cincinnati, États-Unis

Depuis les années 1990, le processus de gentrification aux États-Unis s'est diffusé dans la hiérarchie urbaine et dans les quartiers plus éloignés du centre-ville. Cet article se concentre sur un secteur de recensement dans la banlieue intérieure d'une ville de taille moyenne aux États-Unis en cours de gentrification entre 2000 et 2016. Alors que l'utilisation des données de recensement pour mesurer la gentrification existe depuis des décennies, un nouvel outil, Google Street View, peut désormais compléter la mesure de la gentrification. À l'aide de données de recensement, d'images Google Street View et de l'indice de gentrification de Hwang (Gentrification, race, and immigration in the Changing American city, Harvard University, Cambridge, 2015), je documente les changements dans l'environnement bâti du quartier de Northside (Tract 74) dans la ville de Cincinnati. L'emplacement accessible de ce tronçon au centre-ville de Cincinnati et à l'Université de Cincinnati/complexe hospitalier ainsi que la disponibilité de logements de haute qualité et à faible coût en ont fait un point focal pour les investissements des particuliers, des entreprises et du gouvernement après 2000. En 2014/16, cet investissement avait transformé l'environnement bâti de Tract 74. Il n'y a aucune preuve que la Grande Récession ait ralenti le processus de gentrification alors que Tract 74 est passé d'un désinvestissement en 2011 à un stade précoce de gentrification d'ici 2014/16.

Ceci est un aperçu du contenu de l'abonnement, accessible via votre institution.


Programme des zones statistiques des participants

Les bases
Le 2020 Census Participant Statistical Areas Program (PSAP) offre aux gouvernements locaux, aux conseils de gouvernement et aux organisations de planification régionale la possibilité d'examiner et de modifier certaines limites statistiques que le U.S. Census Bureau utilise pour compter les habitants de notre communauté.

PSAP dans le Triangle
En participant au PSAP, la région du Triangle disposera à terme des données les plus pertinentes et les plus utiles possibles sur la population, le revenu et le logement pour des analyses géographiques sur de petites zones. Le Census Bureau utilise des limites statistiques pour tabuler les données du recensement de 2020, de l'enquête communautaire américaine, du recensement économique et d'autres enquêtes. Les données compilées dans les zones géographiques PSAP sont utilisées par les agences fédérales, étatiques et locales à des fins de planification et à des fins futures, ainsi que par le secteur privé, les universités et le public. Les zones géographiques statistiques standard comprennent : les secteurs de recensement, les groupes d'îlots de recensement et les localités désignées de recensement (CDP).

Sensibilisation et coordination avec nos partenaires
Triangle J COG a travaillé avec ses sept comtés et d'autres parties locales intéressées pour s'assurer que les priorités de la région étaient correctement prises en compte dans la délimitation et la vérification des limites statistiques. Les données de recensement pour les zones statistiques mises à jour sont utilisées pour préparer des demandes de subvention pour financer des programmes de développement communautaire et régional, d'éducation, d'agriculture, d'énergie et d'environnement, ainsi que d'autres améliorations et améliorations communautaires nécessaires. Les données du recensement sont utilisées pour planifier les besoins futurs de la communauté, ce qui a nécessité la sensibilisation et l'engagement de plusieurs départements du comté, tels que la planification, les travaux publics, les transports et les SIG/technologies de l'information. En coordination avec les comtés, les MPO et les RPO, le TJCOG a soumis le package PSAP final au Census Bureau le 15 mai 2020. Le Census Bureau commencera à publier les géographies du recensement de 2020 en décembre 2020. La prochaine occasion d'examiner et de délimiter zones statistiques est prévue pour le Recensement de 2030.

Résultats de la délimitation et de la vérification du PSAP
En coordination avec le gouvernement local et les agences de planification des transports, TJCOG a délimité et vérifié les limites statistiques du recensement pour nos sept comtés. De plus, le personnel de TJCOG et de CAMPO a coordonné étroitement avec le COG régional de Kerr-Tar pour s'assurer que les TAZ de Franklin, Granville et Person figurent dans le travail de Kerr-Tar. En fin de compte, Triangle J COG a soumis 119 secteurs et 430 groupes d'îlots en tant qu'ajouts aux géographies du recensement de 2010, ce qui totalise 480 secteurs et 1 299 groupes d'îlots dans la région de Triangle. Les limites statistiques, telles que les secteurs et les groupes de blocs, divisent de vastes zones géographiques en zones locales plus petites. L'augmentation des secteurs et des groupes de blocs fournira à TJCOG et à ses communautés membres les données les plus pertinentes et les plus utiles possibles sur la population, les revenus et le logement dans la région du Triangle.

Une ventilation complète du processus, du calendrier et des résultats du programme PSAP du TJCOG est disponible dans le document du Programme des zones statistiques des participants au recensement de 2020, rédigé le 29 mai 2020.

2020 Participant Statistiques Domaines Matériaux

Activités du TJCOG

Guides de référence des programmes rapides et des amplis

TIGERweb
Utilisez TIGERweb pour passer en revue les domaines statistiques 2020

Reportez-vous au programme rapide de vérification PSAP et au guide du répondant pour obtenir des instructions sur la façon d'utiliser TIGERweb pour examiner les domaines statistiques PSAP 2020.


Disponibilité électronique :

RecensementCD 1980 [ressource électronique]
Nouveau-Brunswick, N.J. : GeoLytics, Inc., 2000
Version 2.0
CensusCD 1980, permet d'accéder aux résultats complets du recensement américain de 1980, jusqu'au secteur de recensement. Plus de 2 500 données démographiques et identifiants géographiques existent pour chaque zone géographique. Un jeu complet de cartes de 1980, ainsi qu'un logiciel de cartographie, ont également été inclus.
trouver à la bibliothèque

RecensementCD 1980 [ressource électronique]
Nouveau-Brunswick, N.J. : GeoLytics, Inc., c1999
Version 1.0
"CensusCD 1980, est le premier produit à permettre l'accès aux résultats complets du recensement américain de 1980, jusqu'au secteur de recensement. Plus de 1 500 données démographiques et identifiants géographiques existent pour chaque zone géographique. Plus de 50 données démographiques du recensement de 1990 ont été reconverties en zones géographiques de 1980. Et un ensemble complet de cartes de 1980, ainsi qu'un logiciel de cartographie, ont été inclus. "--Introd.
trouver à la bibliothèque

Blocs CensusCD [ressource électronique] : données et cartes complètes des blocs américains
[East Brunswick, New Jersey] : GeoLytics, 1998
Version 1.0
" . contient toutes les données sur la population et le logement des fichiers STF 1B et PL94-171 du Census Bureau, les dernières limites TIGER et plus de 50 identificateurs géographiques, y compris les codes FIPS de 1980 et les relations entre le code postal et les blocs de recensement. - Guide de l'utilisateur, feuille 2.
trouver à la bibliothèque

Base de données sur les changements de quartiers du recensement (NCDB) [ressource électronique] : données sur les secteurs 1970-2000 : variables sélectionnées pour les secteurs de recensement des États-Unis pour 1970, 1980, 1990, 2000 et la cartographie aussi !
Version longue version 1.0
E. Brunswick, NJ : GeoLytics, c2003
Egalement disponible sur 1 CD-ROM : col. 4 3/4 po.
Contient des données nationales au niveau des secteurs des recensements décennaux de 1970, 1980, 1990 et 2000. Combine les données du U.S. Bureau of the Census en un seul produit avec des variables et des limites de secteurs qui sont définies de manière cohérente au cours des années de recensement.
trouver à la bibliothèque


Utilisation de l'analyse géospatiale des données du recensement américain pour étudier la dynamique de l'urbanisation et de la consommation des terres

Les données du recensement américain géographiquement référencées fournissent une grande quantité d'informations sur l'étendue de l'urbanisation et de l'utilisation des terres. Le dénombrement de la population, le nombre d'unités de logement et leurs taux d'inoccupation, ainsi que les paramètres démographiques et économiques tels que la composition raciale et le revenu des ménages, et leur évolution dans le temps, peuvent être examinés à différents niveaux de résolution géographique pour observer les schémas de fuite urbaine, de la réurbanisation et l'étalement. Cet article passera en revue la littérature sur l'application antérieure des données de recensement dans un contexte géospatial. Il identifiera les forces et les faiblesses et abordera les défis méthodologiques des approches basées sur le recensement pour l'étude de l'urbanisation. À cette fin, un aperçu détaillé de la structure géographique des données du recensement américain et de son évolution est fourni. Les erreurs écologiques et le problème d'unité de surface modifiable (MAUP) sont discutés et la densité pondérée de la population comme alternative plus robuste à la densité de population brute est introduite. D'un intérêt particulier sera la comparaison de la littérature et l'intégration des données du recensement avec des méthodologies alternatives, par ex. basé sur la télédétection. L'objectif général de cet article est de jeter les bases d'une utilisation optimale des données de recensement à haute résolution dans l'étude de l'urbanisation aux États-Unis.

Mots clés
Étalement, étalement urbain, ville, densité de population, densité de population pondérée, recensement, recensement américain, géographies de recensement, urbanisation, banlieue, fuite urbaine, réurbanisation, consommation des terres, utilisation des terres, efficacité d'utilisation des terres, LULC, télédétection, analyse géospatiale, SIG , Croissance, Croissance urbaine, Répartition spatiale de la population, Limites de la ville, Étendue urbaine, Environnement bâti, Forme urbaine, Interpolation aréale, Échelle, Échelle spatiale, Étude longitudinale, Cartographie asymétrique, Sophisme écologique, MAUP, Problème d'unité de surface modifiable, Métriques


Comment les changements de secteurs de recensement peuvent être utilisés pour un gain financier.

Voici une histoire intéressante sur la façon dont la géographie du recensement peut devenir très politisée.

il y a une inquiétude concernant un changement de limites dans le secteur de recensement du centre-ville de Pittsburgh (305) lors du recensement de 2020. Une partie du terrain a été allouée au district voisin de Hill pour tenter de sécuriser une zone d'opportunité fédérale afin d'attirer des investissements dans le quartier. Cette désignation permettrait aux entreprises privées de profiter d'avantages fiscaux en investissant dans la région.

Donc quel est le problème? Certains membres de la communauté sont las de tout nouveau développement dans le quartier qui pourrait attirer des résidents plus aisés. Cette zone est le centre historique de la communauté afro-américaine de Pittsburgh. (https://en.wikipedia.org/wiki/Hill_District_(Pittsburgh). Le groupe le plus actif est la Hill Community Development Corporation. Ils craignent qu'un changement démographique ne soit préjudiciable au quartier car toute augmentation des revenus le niveau rendrait la Colline inéligible pour le logement abordable et d'autres efforts de développement communautaire (tels que le programme de subventions communautaires du HUD)

Selon PublicSource, il y a eu des communications entre l'organisation des Penguins de Pittsburgh et le Département du développement communautaire et économique (DCED) de l'État de Pennsylvanie pour tenter de rendre la zone éligible à une zone d'autonomisation. En outre, le bureau du maire de Pittsburgh a contacté l'Internal Revenue Service au sujet d'une modification des limites du recensement pour inclure les parties de la région de Hill dans le tract (la section qui comprenait le stade de hockey).

À l'heure actuelle, dans l'état actuel des choses, une réunion sera organisée par le Hill CDC à la demande de l'organisation Pittsburgh Penguin pour discuter de la question. Cette réunion est fixée au 15 mars 2021.

Revenons un peu en arrière et commençons par ce qu'est un secteur de recensement et quel est le processus d'examen.

Selon le US Census Bureau, une région est une « division géographique relativement permanente d'un comté ou d'une entité statistiquement équivalente définie pour la tabulation et la présentation des données du recensement décennal et d'autres programmes statistiques sélectionnés ». Tous les dix ans, lors du recensement décennal, la Division de la géographie du Census Bureau mène un programme appelé Programme des zones statistiques des participants (PSAP) . Selon l'avis final du registre fédéral 11/2018, le PSAP permet «gouvernements ou organisations désignés l'occasion d'examiner et, si nécessaire, de suggérer des mises à jour des limites et des attributs des secteurs de recensement dans leur zone géographique par le biais du Programme des zones statistiques des participants (PSAP). Le programme comprend également l'examen et la mise à jour des groupes d'îlots de recensement, des lieux désignés de recensement et des divisions de comté de recensement..”.

Ainsi, s'ils étaient désignés, la ville de Pittsburgh et le comté d'Allegheny étaient en mesure de créer et d'examiner toute modification apportée aux secteurs de recensement, aux groupes d'îlots de recensement, aux lieux désignés de recensement (CDP) et aux divisions des comtés de recensement avant leur publication. Le ou les examinateurs auraient examiné les changements et contacté le Census Bureau s'ils avaient des préoccupations ou des changements concernant les zones géographiques. Toute modification apportée au Tract 305 est passée par un processus local et fédéral. Le ton de l'article semble vouloir blâmer le recensement pour le changement de frontière. (S'il n'y avait pas eu d'examen local, tout changement proposé par le recensement aurait été adopté). Le Census Bureau n'a pas encore commenté la question.

Après avoir lu l'histoire, j'ai quelques questions.

  • Y a-t-il eu un examen local du tract ?
  • Qui étaient les critiques ?
  • Sinon, pourquoi ne l'ont-ils pas rendu public ?
  • Pourquoi l'ingérence d'une organisation privée a-t-elle été envisagée ?

Espérons que nous obtenons des réponses.

COMMENTAIRES (0)

Le plus récent en premier Le plus ancien en premier Le plus récent en premier Le plus aimé Le moins aimé Aperçu Poster un commentaire…SuivantPrésentation de mon podcast : Data For Everyonedata, podcast


Estimation du comportement de transport des ménages et des coûts de logement

Une fois ces modèles élaborés, nous pouvons les utiliser pour estimer le nombre moyen d'automobiles par ménage et les kilomètres parcourus en véhicule et le pourcentage de navetteurs utilisant le transport en commun pour tous les 198 373 groupes d'îlots de recensement couverts par l'indice. Ceci est accompli en branchant les données pour chacune des 15 variables prédictives pour chaque groupe de blocs à la fois dans le modèle SEM et le modèle VMT.

Figure 3 : Méthode générale d'estimation de l'utilisation des transports à partir de modèles de régression

La plupart des variables d'entrée proviennent de données qui décrivent les caractéristiques d'un quartier qui sont communes à tous ceux qui y vivent : densité de population, possibilité de marche, accès et qualité des transports en commun et accès à l'emploi (ce sont toutes des caractéristiques de l'environnement bâti). Pour les entrées qui identifient les caractéristiques, les résidents eux-mêmes - taille du ménage, revenu et nombre de navetteurs - en utilisant les données réelles pour chaque groupe de blocs, produiraient un indice très utile. Étant donné que les gens ont tendance à vivre dans des endroits qu'ils peuvent se permettre, l'utilisation de données démographiques réelles produirait une carte où la majorité des quartiers semblent plus ou moins abordables. Au lieu de cela, nous avons choisi huit profils de ménages&mdashcaractérisés par le nombre de membres de la famille, le revenu et le nombre de navetteurs&mdash qui représentent un large éventail de familles américaines, fournissant des informations utiles sur l'abordabilité pour une variété d'utilisateurs différents, y compris les consommateurs, les agences de planification, les professionnels de l'immobilier , et des conseillers en logement.

Tableau 3 : Profils des ménages utilisés pour estimer l'utilisation des transports
Profil du ménage Revenu Taille # de navetteurs
Famille à revenu médian MHHI 4 2
Personne à très faible revenu Seuil national de pauvreté 1 1
Personne qui travaille 50% de la MHHI 1 1
Professionnel célibataire 135% de la MHHI 1 1
Couple de retraités 80% de la MHHI 2 0
Famille monoparentale 50% de la MHHI 3 1
Famille à revenu moyen 80% de la MHHI 3 1
Famille bi-professionnelle 150% du MHHI 4 2

MHHI = Revenu médian des ménages pour une ASFC donnée

Chaque ASFC et comté rural a un ensemble unique de profils de ménages. Nous utilisons ces profils régionaux en combinaison avec les variables d'entrée au niveau du groupe de blocs du modèle pour estimer les coûts de logement et de transport des ménages. Les figures 3 et 4 illustrent comment cela est fait pour les propriétaires et les locataires, respectivement, à l'aide du SEM, qui estime le nombre d'automobiles par ménage, le pourcentage de navetteurs utilisant les transports en commun et les coûts de logement pour chaque groupe d'îlots de recensement et comté non métropolitain. Il en résulte 16 ensembles d'estimations pour ces 3 variables : un ensemble de propriétaires et de locataires pour chacun des huit profils de ménages.

Figure 4 : Estimation des voitures par ménage, du pourcentage de navetteurs utilisant les transports en commun et des coûts de logement pour huit profils de ménages propriétaires différents
Figure 5 : Estimation des voitures par ménage, du pourcentage de navetteurs utilisant les transports en commun et des coûts de logement pour huit profils de ménages locataires différents

La figure 5 illustre comment cela fonctionne à l'aide du modèle VMT, générant des estimations VMT pour les huit profils.

Figure 6 : Méthode d'estimation de la VMT pour huit profils de ménages locataires différents


Analyse et définition des systèmes d'information géographique intégrés (SIG) du cadre tectonique du nord du Mexique

Les structures de rupture crustale réactivées au cours de l'histoire tectonique du nord du Mexique sont l'expression en surface de plans de faiblesse, sous la forme de traits rectilignes simples ou composites ou légèrement incurvés, définis comme des linéaments. À moins qu'ils ne soient autrement définis comme des failles décrochantes, les linéaments font partie de zones tectoniques parallèles et subparallèles obliques convergentes ou obliques divergentes recoupant la Sierra Madre occidentale et le nord du Mexique, dans une direction NO. Ces zones de cisaillement sont la réponse à la subduction oblique de la plaque Farallon sous l'Amérique du Nord. L'analyse cinématique de cinq sites sélectionnés dans le nord du Mexique, trois bassins et deux zones de cisaillement de compression, a prouvé qu'il était possible de combiner un diagramme de mécanisme de cisaillement et des modèles à partir de matériaux analogiques, avec des systèmes d'imagerie satellitaire et d'information géographique, pour aider à définir le mouvement des failles décrochantes . Cela a été fait en utilisant un processus d'ingénierie inverse en comparant les géométries. L'un des sites évalués, impliquant le bassin de Parras, le bloc de Coahuila (CB), la faille de San Marcos, une faille PBF-1 postulée, a permis une reconstruction palinpastique du CB qui a corroboré les résultats du mouvement vectoriel défini, en plus d'une extension de ∼25% dans une direction nord-ouest sud-est. Une compilation basée sur SIG et des études structurelles régionales géoréférencées par plusieurs chercheurs ont été utilisées comme zones de contrôle au sol (GCA), leur interpolation et leur interprétation, ont abouti à une carte-cadre tectonique du nord du Mexique. De plus, des modèles de relief ombré superposés par les linéaments/couche de failles ont permis des analyses structurales de bassins liés à ces structures majeures. Deux résultats importants ont été obtenus de cette étude : la faille de Tepehuanes-San Luis (TSL) et la faille de Guadalupe, nommées ici, déplacent respectivement le graben de Villa de Reyes et le graben d'Aguascalientes vers le SE, confirmant leur vecteur latéral gauche. mouvement après TSL a été déplacé vers le sud par le décrochement latéral droit de la faille Taxco-San Miguel de Allende. Le deuxième résultat renvoie à l'hypothèse que la Mesa Central a été amenée à son emplacement actuel par une zone de subduction située au nord. Cette zone de subduction coïncide avec plusieurs chercheurs qui ont postulé l'idée. Les zones de compression font référence à des segments du Sinforosa et à une faille présumée d'Aquinquari située dans le terrane stratotectonique de Guerrero considéré comme une zone hautement minéralisée. Des anomalies négatives proches de -200 milligals suggèrent fortement un bloc cratonique identifié dans l'ouest de Chihuahua, il s'appelle Western Chihuahua Cratonic Block (WCCB). Dans la partie sud-ouest du craton nord-américain, les provinces d'âge sont bien documentées, mais l'idée du bloc par rapport à la ceinture mobile n'a pas été mise en avant ou soulignée. La présente étude combine des données de plusieurs types, sédimentologiques, structurelles, géochimiques ignées et géochronologiques pour évaluer ce comportement dans le sud-ouest de l'AN, et le bloc proposé est testé par rapport à ces données. La présence du WCCB est étayée par une grande variété de données. Des bassins, des creux, des aulacogènes, un volcanisme bimodal et d'autres caractéristiques de rift et d'épaulement de rift, caractérisent les ceintures mobiles spatialement contraintes. Les ceintures mobiles entourant le WCCB contiennent des enregistrements géologiques des événements remontant à 1,4 Ga, différents aspects étant dominants au cours du temps géologique. Les ceintures mobiles participeront à la compression (subduction), à l'extension (rifting) et à la transformation (latérale) des failles. Le WCCB peut avoir été dérivé du craton nord-américain étroitement adjacent par l'action d'une ceinture mobile. Cette étude a montré que l'intégration des données est essentielle, car permet de détecter des différences d'hypothèses pour le même événement dans la même zone. Cette capacité d'intégration est ce qui fait des systèmes d'information géographique intégrés un outil puissant, non seulement pour leur synergie, mais parce qu'ils peuvent être combinés avec des techniques spécifiques qui fournissent des données avant d'aller sur le terrain. Que la question de la définition du cadre tectonique du nord du Mexique puisse être résolue ou non, dépend de la viabilité d'intégrer des volumes de données de recherche, d'hypothèses ou de cartes, et rassemblées sous le même cadre géographique.


Introduction

Au cours des 15 dernières années, les chercheurs en santé publique ont documenté des disparités dans l'état de santé associées aux caractéristiques structurelles et sociales des quartiers qui ne peuvent être expliquées par des différences individuelles dans les profils de risque. Un large éventail de résultats pour la santé a été pris en compte dans la recherche sur les quartiers, y compris les indices de la santé physique des adultes [1], [2], [3], [4], [5], [6], [7], [8], [9], la santé mentale des adultes [10], [11], [12], [13], [14], [15], [16] et la santé des enfants [6], [7], [17], [18], [19], [20], [21], [22], [23], [24], [25], [26], [27], [28].

Les données sur les résultats de santé à plus petite résolution géographique (par exemple, les données au niveau individuel référencées spatialement) sont de plus en plus disponibles, approfondissant l'étude des effets du quartier sur la santé. Malheureusement, les sources de données secondaires, telles que le recensement, peuvent être inadéquates pour ces études, car l'agrégation sur des zones géographiques de recensement (par exemple, des groupes de blocs, des secteurs, etc.) perd une grande partie de la variation qui est précieuse pour l'analyse des données au niveau individuel. Pour remédier aux limites des sources de données secondaires, un certain nombre de chercheurs en santé publique ont utilisé des audits communautaires pour fournir non seulement des données actuelles sur les quartiers, mais aussi une observation directe des conditions des quartiers.

Deux revues récentes de l'utilisation des méthodes d'observation de quartier dans la recherche en santé publique [29], [30] documentent le large éventail d'approches utilisées dans la mise en œuvre des méthodes d'audit communautaire et les limites de la littérature existante sur ces méthodes. La résolution spatiale est l'un des facteurs clés le long desquels les données de l'environnement bâti diffèrent. Il y a plusieurs raisons à cela. Premièrement, si des données secondaires sont utilisées, le chercheur doit ajuster et utiliser la meilleure résolution spatiale disponible. En l'absence d'autres données disponibles, certaines informations sur l'environnement bâti valent certainement mieux que rien et certaines questions politiques peuvent être largement évaluées sans données à haute résolution. Deuxièmement, les données à plus haute résolution spatiale sont plus coûteuses à obtenir car un plus grand nombre d'observations par zone est nécessaire. Les coûts et les avantages de la collecte et de l'analyse des données d'observation à haute résolution par rapport aux données d'observation à faible résolution doivent être pris en compte. De plus, l'échelle de la question de recherche détermine parfois la résolution des données utilisées. Il n'est pas pratique pour les chercheurs qui étudient l'impact d'un programme national ou étatique d'essayer d'utiliser la méthode présentée ici pour collecter des données d'observation à haute résolution. Cependant, des études de recherche axées sur des zones géographiques plus petites (au sein d'un quartier ou d'un secteur urbain) pourraient trouver des données à haute résolution plus avantageuses. En bref, la question de recherche devrait déterminer la résolution spatiale nécessaire.

Dans cet esprit, il est nécessaire d'examiner la fiabilité et l'utilité prédictive des données d'observation recueillies à divers niveaux d'agrégation. L'examen de la robustesse de la relation entre les mesures de résultats individuels et les données d'observation à différents niveaux d'agrégation géographique est essentiel pour étudier la présence de biais potentiels de variables omises qui résultent de la corrélation des limites géographiques avec des caractéristiques individuelles non observées. De plus, les initiatives politiques qui opèrent à différentes étendues géographiques seraient mieux informées si la robustesse des résultats aux schémas d'agrégation de niveau inférieur (et supérieur) était évaluée. Cependant, en raison du niveau d'agrégation spatiale auquel les données d'observation sont souvent collectées, la plupart des ensembles de données existants ne sont pas bien adaptés pour une enquête approfondie de cette robustesse. Dans cet article, nous présentons une nouvelle méthodologie d'audit communautaire interdisciplinaire pour collecter des données sur les facteurs du quartier dans la plus petite unité géographique possible et évaluons les avantages de l'utilisation de données à une résolution spatiale aussi élevée pour des études au niveau micro sur les résultats de santé liés au quartier.

Des travaux antérieurs dans ce domaine, tels que les nombreuses données collectées conjointement avec le Projet sur le développement humain dans les quartiers de Chicago (PHDCN) et bien d'autres, se sont concentrés sur le bloc de façade - ou les parcelles faisant face au même segment de rue ou "bloc" - comme le plus petit niveau géographique pour collecter des données d'observation, mais notre méthodologie augmente la résolution spatiale en analysant la parcelle. Dans les quartiers résidentiels, une parcelle se compose de la maison et de la cour environnante ou de la totalité de la propriété qu'un propriétaire possède et est évaluée à des fins fiscales. La plupart des outils d'audit de quartier mesurent certains éléments des conditions physiques et sociales du quartier. La méthodologie d'observation parcellaire que nous présentons se concentre exclusivement sur la dimension physique. Raudenbush et Sampson [31] ont analysé les données du PHDCN et ont découvert que les mesures des troubles physiques sont des indicateurs pertinents de l'état du quartier à une résolution spatiale plus élevée que les mesures des troubles sociaux. De plus, ils notent que la fiabilité des mesures de troubles physiques par bloc facial peut être améliorée en augmentant le nombre d'items observés pour chaque bloc facial. La collecte d'observations parcellaires permet d'atteindre cet objectif. Au-delà du rationnel basé sur l'écométrie mis en avant par Raudenbush et Sampson [31], il existe également de nombreuses raisons pratiques pour étendre la collecte de données pour inclure les observations parcellaires : (1) elle permet une flexibilité maximale en ce qui concerne l'agrégation spatiale (2) elle permet la chercheur de faire la distinction entre les observations que le ménage a un contrôle direct (c'est-à-dire l'entretien de leur cour/propriété) et les observations qui sont impactées par d'autres dans la communauté (c'est-à-dire l'entretien des espaces communs tels que les parcs ou l'entretien d'autres propriétés dans le quartier ) et (3) il permet de relier les données et les résultats de la recherche aux valeurs des propriétés qui ont un impact direct sur les politiques à travers l'assiette fiscale. Cependant, alors que les avantages semblent importants, aucun travail systématique n'a été effectué pour déterminer si les avantages l'emportent sur les coûts de collecte de données à ce niveau micro.

Un problème lié à l'agrégation géographique est le problème de la définition opérationnelle des limites des quartiers - ou, plus généralement, le problème des unités de surface modifiables (MAUP) [32]. Lorsqu'ils abordent la question de savoir comment mesurer les caractéristiques du quartier, Guo et Bhat [33] déclarent que « nous devrions mesurer ce qui compte pour les gens sur la zone qui compte vraiment pour les gens » (p. 31). Cela suggère que les limites des quartiers doivent être choisies de manière réfléchie et peuvent varier en fonction de la question de recherche à l'étude. À ce jour, quelques chercheurs étudiant les effets du contexte du quartier sur la santé ont utilisé des définitions spatiales sophistiquées des quartiers [34], [35], [36], [37], [38], mais aucune étude n'a été en mesure de comparer de manière exhaustive l'utilité des données d'audit communautaire collectées à différents niveaux d'agrégation. Il s'agit d'une lacune importante dans la littérature existante. Boone et al [39] constatent que les associations entre l'activité physique et la connectivité des rues varient selon le milieu et l'échelle géographique. Il en va probablement de même des associations entre les résultats pour la santé et les données d'observation du quartier. Le plus souvent, cependant, les chercheurs en santé publique s'appuient sur les limites administratives des quartiers telles que les secteurs de recensement ou les groupes d'îlots de recensement, et une seule échelle géographique est analysée.

L'instrument d'observation développé se veut utile pour analyser la relation entre le lieu et la santé et le bien-être des individus tout en évitant les biais créés par le MAUP. Les données à haute résolution spatiale peuvent-elles améliorer les études et, en particulier, les implications des politiques de santé publique concernant la relation entre les conditions de quartier et la santé ? Bien que nous reconnaissions que les données à une résolution spatiale inférieure sont utiles et suffisantes dans certains cas, nous pensons qu'une résolution plus élevée présente des avantages qui peuvent améliorer et affiner les implications politiques. Premièrement, les données à haute résolution spatiale permettent au chercheur une flexibilité presque complète dans la spécification des limites des quartiers et, par conséquent, une enquête approfondie sur le biais MAUP est possible (bien que nous notions qu'une analyse approfondie de cette question dépasse le cadre de cet article). Par exemple, des études peuvent trouver une corrélation statistiquement significative entre l'état moyen du secteur de recensement et l'obésité. Cependant, à moins d'approfondir cette relation à différents niveaux de résolution géographique, on ne sait pas si les résultats sont biaisés par d'autres variables omises corrélées à la définition du secteur géographique de recensement. Deuxièmement, les données à haute résolution spatiale permettent aux décideurs de la santé publique d'identifier le niveau géographique le plus approprié pour les interventions de santé publique. Poursuivant avec l'exemple précédent, une relation entre l'état du secteur de recensement et la santé est une observation importante, mais la pertinence des politiques peut être considérablement améliorée si des informations supplémentaires étaient disponibles à l'échelle géographique selon lesquelles les ressources publiques limitées devraient être déployées pour améliorer la santé publique. Les décideurs politiques doivent connaître les implications comparatives de la mise en œuvre, par exemple, d'initiatives de nettoyage de quartier local à grande échelle dans tout le secteur de recensement, par rapport à des initiatives concentrées pour améliorer uniquement les zones les plus délabrées du secteur de recensement. Les données d'observation du quartier permettront à la recherche pour spécifier exactement quelles définitions géographiques importent le plus pour une implication politique particulière.

L'objectif de ce rapport est triple. Tout d'abord, nous décrivons la méthodologie et la façon dont la méthode a été mise en œuvre pour assurer la collecte de données d'observation de haute qualité. Ensuite, nous analysons la fiabilité des données et les relations trouvées entre les variables observées. Enfin, nous examinons l'utilité de ces données pour examiner les conditions des quartiers à différents niveaux d'agrégation et comment ces données pourraient être utilisées dans des études sur les quartiers et la santé.


Modernizing the U.S. Census (1995)

APPENDIX FBusiness Uses of Census Data

Census data are used by many in the private sector, by for-and not-for-profit organizations. Retail establishments and restaurants, banks and other financial institutions, media and advertising, insurance companies, utility companies, health care providers, and many other segments of the business world use census data. In the past, household-level data on consumers at the zip-code and census-tract levels have been classified by characteristics such as age, sex, and income. Increasingly, however, individual households are contacted by direct mail or some other type of direct media (e.g., newspaper inserts). This appendix contains some examples of uses of census data by various segments of the business community&mdashevidence of the great use of census data by businesses is provided by the Division of Research and Statistical Services of the South Carolina Budget and Control Board (the state data center for census information in South Carolina), which estimated that 35 percent of the annual requests received for census data are from businesses.

Small-area data are important for many business applications. Some businesses use small-area data as a substitute for household-level data. More important, however, is the ability to aggregate the small-area census data to nonstandard geographic areas&mdashfor example for business trade areas. As long as these data are available, businesses can create aggregations of data into areas for which data have never been published. The smaller the level of geography for which data are available, the more creatively businesses can create aggregations and the more precisely they can define the geographic area.

Several key types of small-area census data (at tract and other geographic levels) are used for business purposes: age education employment housing

unit age, tenure, heating fuel, type, value, and rent income occupation persons in household phone availability race and ethnicity commute to work and vehicles per household. Products&mdashsuch as maps showing the concentration of a specific racial or ethnic group by specific areas (e.g., county, census tract, or zip code) or maps showing moderate-, high-, or low-income areas&mdashcan be produced using census data. Data also can be used to create consumer profiles, which can help in targeting advertising to current and potential customers finding new customers and analyzing locations, selecting sites, and competing against other businesses in a market area. Both the maps and consumer profiles (which may also be linked to a map) are used by businesses to target their markets more effectively. As the use of geographic information systems has grown, the demand for small-area geographic data has also grown. And, in turn, the new-found congruence of accessible geographically referenced small-area data is promoting the use of small-area census data for business purposes even further.

For example, a retail corporation with plans to expand could analyze potential markets before selecting sites. A specific case study (Kintner et al., 1994) involved examining and assessing various markets for a corporation's planned expansion. Several potential markets were selected by the corporation for the expansion, and the corporation wanted to determine which of the potential markets would be the most successful. Although the company's staff would make the final decision about the exact location of the sites, consultants were hired to analyze the potential revenue for each market. First, the consultants developed a model for analyzing the potential markets. The model took into account a number of variables&mdashsuch as population, number of firms employing 100 or more workers, number of vehicles entering the county, and size of the transient population&mdashthat could help predict the viability of a site in areas selected for analysis. Some data were from business sources, but census data provided an essential component for analysis. Information on existing markets was used in the model to help determine its accuracy. Then, the predicted revenues for each of the existing locations generated by the model were compared with the actual revenues of those markets, enabling the corporation to assess and identify the strengths and weaknesses of the model. Next, data were collected for the potential new markets. By adding the new data to the model, revenue estimates were created for the potential markets, and the markets were ranked based on their predicted revenue. Markets that were the most promising were selected for additional analyses and reviewed by the corporation's staff, who then were able to select the best markets for the corporation's expansion.

It is clear to the panel that businesses use small-area data creatively and effectively for a number of applications, and that small-area census data are important to those applications. However, it is difficult to foresee the effects of a loss of small-area census data. There could be a negative impact on efficiency and competitiveness&mdashimpacts that would be difficult to measure.

This appendix describes the business uses of census data for a variety of

industries, including retail and restaurant, banks and other financial institutions, media and advertising, insurance, utilities, health care, nonprofit, and others. The review is not exhaustive of all industries, nor comprehensive in the many ways that census data are used. Rather, the purpose is to highlight several common uses, for a variety of industries, to illustrate the specific ways census data are used to reach business decisions and to improve business marketing. The examples cited below are taken from Thomas and Kirchner (1991), a recent publication on desktop marketing that describes ways that demographic data are used by businesses.

RETAIL AND RESTAURANT

Retail and service businesses, such as restaurants, use data to decide where to locate their stores and how to effectively market their goods and services. A retail chain might use population, poverty, income, and labor-force data for a state and for a city or county to study the possibility of a retail outlet. For example, county-level population figures for women aged 16-34 years could be used to help determine the location for a maternity shop. Or a children's clothing retailer could use age data, income data, and retail statistics to select a location.

A fast-food restaurant chain was able to better target employee recruiting efforts and improve service by analyzing concentrations of the population with desirable employee traits/lifestyle characteristics (including longevity of employment). To accomplish this task, the restaurant chain identified the characteristics of its current base of employees and located areas with high concentrations of potential employees&mdasha population whose characteristics were the same as the most successful current employees. In creating the profile of current employees, past and present employees with at least 6 months of service with the restaurant were categorized into 1 of 50 categories based on census block-group characteristics of their neighborhoods. The categories were charted according to the percentage of total current employees falling into the category. Using the data, the restaurant was able to identify categories of workers that were likely to become restaurant employees and determine areas where they lived. Recruiting efforts were targeted to those areas using mail and newspaper advertisements, among other techniques. The restaurant has found this ability to be useful in existing markets and new markets, and it has helped reduce turnover in the restaurants, resulting in improved customer service (Thomas and Kirchner, 1991:55-60).

For selecting restaurant sites, a general area, as well as specific sites for the restaurant can be evaluated. By looking at selected demographic data by specific levels of geography (e.g., counties and zip codes) the characteristics of the potential customers can be determined. Employment data at those same levels may also be evaluated. These analyses taken together can help the restaurateur

select the best site for a successful restaurant (Thomas and Kirchner, 1991:61-63).

BANKS AND OTHER FINANCIAL INSTITUTIONS

Like retailers and restaurateurs, banks and other financial institutions can select the best locations for branch offices by analyzing population, demographic, and economic data from the census. More importantly, however, banks and financial institutions require median household income and income distributions by census tracts to ensure compliance with federal mortgage lending guidelines regarding race, and for meeting other regulatory requirements, particularly the Community Reinvestment Act, Home Mortgage Disclosure Act, and the Federal Insurance Improvement Act of 1992.

For example, the Community Reinvestment Act mandates that financial institutions meet deposit and credit needs in the communities they serve. The federal agencies that supervise financial institutions are required to assess whether the financial institutions in an area are meeting the needs of the community. To assess its compliance with the mandates of the Community Reinvestment Act, a bank wanted to determine the ratio of its loans to its deposits. Using customer data and a software system that is able to link demographic and client information, the bank was able to determine the loan-to-deposit ratio for its service areas. Thus, the bank was able to assess itself whether it was complying with the Community Reinvestment Act before the regulatory agencies conducted their audits. If there were areas with a discrepancy between deposits and loans, the bank would be able to make corrections in those areas (Thomas and Kirchner, 1991:114-116).

Census data can be used by banks to develop locally focused marketing programs. For example, a bank can determine the potential success of a particular new service by looking at how and where to market the service. A demographic profile of service areas based on age, deposits, household income, and credit use can be created. By grouping and mapping the frequency of the four variables mentioned above, along with a consumer profile, areas where the service is likely to be used can be identified. Those areas then can be targeted for promotion and implementation of the new service (Thomas and Kirchner, 1991:93-97).

In trying to determine if acquiring a competing banking institution (Bank B) would be a feasible and profitable way to expand and diversify its services, Bank A wanted to assess the proximity of Bank B's branches to its existing branches, the comparability of existing customers of Bank A with Bank B, and the comparability of services offered by both banks. The population (current and future projected) of the areas surrounding branches was compared, and income estimates for Bank B's locations were analyzed by census tract level (Thomas and

Kirchner, 1991:102-108). Using these analyses, Bank A is able to make the best decision about acquiring the competing bank.

A bank can analyze the potential performance of new and existing markets by developing a profile for evaluating those markets. By combining demographic characteristics of data on national financial behavior with demographic data for a particular market, a profile of the bank's service area can be developed. Using the average state performance of branches as a benchmark, the bank can determine the amount of increased business for areas performing below the state average if those areas grow to the state average level. This can help the bank determine areas for increased market analysis and marketing efforts, while also pinpointing markets that are performing at or above the state average that need to be maintained and protected from competitors (Thomas and Kirchner, 1991:111-113).

MEDIA AND ADVERTISING

Newspapers use census data in stories to profile the demographics of blocks, neighborhoods, towns, cities, counties, states, and other geographic areas. Census data also provide demographic background for other stories of general and specific interest to the public, e.g., what are the socioeconomic characteristics of areas with the most lawlessness in the Los Angeles riots? What is the most ''middle class" tract in L.A. County? And what are commuter travel patterns in Orange County? Examples included in responses to the panel's survey of state data centers (see Appendix E) noted that all variables to the block-group level in various census geographic files can be used to describe the demographic and economic characteristics of places and areas. Also reported in a survey response was that the Los Angeles Times recently used 1990 census data in more than 300 news stories within one year.

The collection of consumer zip codes may be used to create a consumer profile for an area. For instance, a radio station might collect a caller's zip code and link it to demographic data to develop profiles of listener preferences (Thomas and Kirchner, 1991:34). In turn, the station can determine the potential success of a particular radio format for a given area and target marketing campaigns accordingly. Those profiles can also be linked with ratings information and used to optimize advertising revenue.

A cable television company analyzed purchase of pay-per-view events by census tract maps (Thomas and Kirchner, 1991:37) and created customer profiles by block-group level. Those customer profiles assisted the company in focussing its marketing efforts to specific customers. For example, pay-per-view sporting events can be marketed to the subscribers that are most likely to purchase the event, rather than to the entire customer base, thus increasing the advertising value.

INSURANCE COMPANIES

In a case study, an insurance company wanted to determine if some of its offices had allowed policies to lapse more than others. The company first wanted to determine if sites with high lapse rates were located in areas with high-risk customers. To determine the different characteristics between lapsed customers and continuing customers, the company created a profile of current customers, as well as a profile of lapsed customers. Based on the profile, the company determined that the continuing customers were generally more affluent and more family-oriented. When the profile for continuing customers was compared to the profile for lapsed customers, the company found that lapsed customers "tended to be more downscale than average" (Thomas and Kirchner, 1991:119). Using the data, the company was able to estimate what the performance of various offices should be, based on their geographic locations. For example, some of the offices were located in areas where the population could be characterized as high-lapse customers. Those offices, it was determined, could expect lower overall performance (Thomas and Kirchner, 1991:117-121).

UTILITY COMPANIES

Utility companies use census data to target low-income areas or areas with special needs, as well as for market research. Most utility companies have special lower rates for poorer, elderly, or disabled customers. Census data help companies note special areas for individual contact and special services and rates. An electric or gas company can use customer records to determine their share of the market. Using customer address information, a utility company can determine areas where it might be desirable to increase customer volume through greater name recognition. Other companies are using census maps to plot the location of their utility lines so they can quickly reference the proximity of lines to population areas.

HEALTH CARE PROVIDERS

Health care providers use census data to determine the need for additional hospital services, physicians, urgent care facilities, or other type of medical services in an area. For example, a hospital used data to study population trends when looking into building an off-site facility in a rural area, so that better health care could be provided to residents in that area. Using characteristics such as race, age, sex, and income for the health service area, a provider can determine if there is a need for additional doctors or other health services in an area. By estimating the need for services in an area, the best site for a doctor's office can be determined (Thomas and Kirchner, 1991:130-136). A hospital's selection of urgent care center sites is aided by analyzing patient records (including address


Voir la vidéo: Tietojen yhdistäminen INDEKSI ja VASTINE-funktioilla