Suite

Comment le localisateur d'adresses sélectionne-t-il l'un des deux points alternatifs dans ArcGIS for Desktop ?

Comment le localisateur d'adresses sélectionne-t-il l'un des deux points alternatifs dans ArcGIS for Desktop ?


J'ai géocodé l'entrée principale des bâtiments sur ma carte et certains bâtiments ont plus d'une entrée. Comment le localisateur d'adresses en sélectionne-t-il un ?

Il me semble qu'il s'agit simplement de choisir au hasard l'un des trois points avec la même adresse.

J'utilise ces données sur un réseau et à des fins de routage, je dois guider les gens vers les entrées principales et les accrocher sur le réseau.


Recherches alternatives

Bien que la recherche d'emplacements d'adresses soit une pratique courante, vous pouvez également utiliser des localisateurs pour rechercher des entités en fonction du nom d'un emplacement, tel qu'un centre commercial ou un bureau. Les localisateurs vous permettent également de rechercher en fonction d'un code, tel qu'un code postal, un secteur de recensement, un numéro d'identification fiscale, un numéro de colis, un code postal ou des coordonnées basées sur un système de référence spatiale. Si vous disposez de données relatives à une intersection plutôt qu'à une adresse, comme l'emplacement d'un accident de voiture, la recherche par intersection ou l'utilisation d'un décalage spatial sur une adresse trouvée est utile.

Le géocodage peut être étendu pour prendre en charge la correspondance de différents types d'emplacements. Voici quelques recommandations sur la façon d'améliorer votre recherche de géocodage.


Street_NoNum_and_ZipCode_Composite

Nom du localisateur Données source La description
4A_SS_NoNum_ZipName Segments de la rue NYS Ensemble de données NYS Street Segments utilisant le nom du code postal pour le nom de la ville dans le localisateur. L'emplacement est placé sur un segment de rue avec le nom correspondant. Veuillez noter qu'il peut s'agir ou non du bon segment de rue.
4B_SS_NoNum_CTName Segments de la rue NYS Le jeu de données NYS Street Segments utilisant le nom de la ville ou de la ville est utilisé pour le nom de la ville dans le localisateur. L'emplacement est placé sur un segment de rue avec le nom correspondant. Veuillez noter qu'il peut s'agir ou non du bon segment de rue.
4C_SS_NoNum_PlaceName Segments de la rue NYS Le jeu de données NYS Street Segments utilisant le nom de lieu alternatif est utilisé pour le nom de la ville dans le localisateur. Ce champ est renseigné à l'aide des villages NYS et des réserves indiennes, des lieux désignés du recensement et des autres noms de code postal acceptables de l'USPS. Ces zones n'existent pas partout, il y aura donc un nombre limité de segments avec cet attribut. L'emplacement est placé sur un segment de rue avec le nom correspondant. Veuillez noter qu'il peut s'agir ou non du bon segment de rue.
5_ZipCodePts Limites du code postal Point placé au centre de gravité des limites du code postal.

Actuellement, le service de géocodage renvoie tous les résultats lors de l'utilisation de l'outil de recherche dans ArcGIS. L'utilisateur sera alors responsable du choix des résultats qu'il souhaite conserver. Les points d'adresse SAM sont les données les plus précises disponibles et doivent être sélectionnés à chaque fois qu'un résultat est renvoyé par l'un des localisateurs de points d'adresse SAM. Si le service de géocodage est utilisé dans l'outil de traitement par lots ESRI, le localisateur renverra une correspondance du premier localisateur auquel il arrive dans l'ordre en cascade. S'il y a plusieurs localisateurs avec le même score ou dans le même localisateur, le premier résultat est renvoyé et il est codé comme une égalité.

Les localisateurs afficheront un champ nommé « User_fld » qui doit être utilisé en conjonction avec le champ Loc_Name. Lorsque le champ Loc_Name contient l'un des localisateurs de point d'adresse (1A, 1B ou 1C), ce champ contiendra un 1,2,3,4 ou un 5. Lorsque le champ Loc_Name contient autre chose que les localisateurs de point d'adresse, le ' User_fld' sera soit NULL, soit "0". Les valeurs numériques correspondent au type de point d'adresse qui a été localisé :

1. Toit
2. Entrée de la structure principale
3. Allée
4. Centroïde du colis
5. Divers

Il existe également un localisateur disponible qui permettra à l'utilisateur de trouver des lieux constitués et non constitués en société dans tout l'État de New York.


Lorsque vous utilisez ArcGIS Maps for Office pour tracer vos données sur la carte, il est important de choisir le bon type d'emplacement.

Adresse et latitude, longitude

Lorsque vous choisissez le type d'emplacement Adresse, les points sont générés à l'aide d'ArcGIS World Geocoding Service par défaut, mais votre administrateur ArcGIS peut également avoir configuré d'autres localisateurs pour votre organisation et défini l'un d'entre eux par défaut.

Pour le type d'emplacement Latitude, Longitude, les données des colonnes d'emplacement x et y identifiées sont utilisées pour générer des points.

Limites administratives standard et types personnalisés

Lorsque vous choisissez une limite administrative standard ou un type d'emplacement personnalisé, les formes appropriées sont localisées et récupérées à l'aide de la ou des colonnes spécifiées pour le type d'emplacement choisi. Cela se fait en associant les lignes de données au type d'emplacement via une colonne commune, appelée clé. ArcGIS Maps for Office utilise généralement le service GeoEnrichment pour localiser les limites administratives standard, mais votre administrateur ArcGIS peut également avoir configuré d'autres localisateurs pour votre organisation et en avoir défini un par défaut.

Le nom de la colonne dans vos données ne doit pas nécessairement correspondre au nom de la colonne dans le type d'emplacement, cependant, les informations de la colonne doivent être dans le même ordre pour produire une correspondance. Lorsqu'une ligne de données ne peut pas être localisée, c'est-à-dire que la forme ne peut pas être récupérée à partir du type d'emplacement, une forme nulle lui est attribuée et n'est pas dessinée sur la carte. Le tableau suivant présente les clés prises en charge pour chaque type d'emplacement :

  • État—Nom de l'État. Il peut s'agir d'un nom complet, d'une abréviation à deux lettres ou du code FIPS de l'État (par exemple, New York, NY ou 36).

Point, ligne ou polygone (déterminé par la carte ou la couche de service d'entités sélectionnée)

Configuré par l'administrateur sur ArcGIS Online ou ArcGIS Enterprise .

Spécifié pour être utilisé dans ArcGIS Maps for Office lors de l'ajout d'une couche à une carte. Voir Ajouter un type d'emplacement personnalisé.

Lors de la localisation de données à l'aide de limites administratives standard ou d'un type d'emplacement personnalisé, il est important de s'assurer qu'il existe une relation un à un entre les lignes de données d'entrée et les formes du type d'emplacement choisi. Dans une relation un-à-un, chaque ligne de données d'entrée correspond à une seule forme sur la carte. Dans l'exemple suivant, chaque ligne de données d'entrée (Profit by state) correspond à un état américain. La colonne State représente la clé unique. La forme de chaque ligne de données d'entrée peut donc être déterminée et dessinée sur la carte. Dans l'exemple suivant, une seule forme de polygone correspondant à chaque ligne des données d'entrée Profit par état (par exemple, Arizona) est dessinée :

Le choix d'un type d'emplacement inapproprié peut entraîner des résultats inattendus. En effet, un type d'emplacement incorrect conduit souvent à une relation plusieurs-à-un ou un-à-plusieurs entre les données d'entrée et les formes du type d'emplacement choisi.


Signature et paramètres de la fonction geocode()¶

La fonction geocode() prend en charge la recherche de lieux et d'adresses au format à champ unique ou au format à champs multiples avec les composants d'adresse séparés en plusieurs paramètres.

L'extrait de code ci-dessous importe la fonction de géocodage et affiche sa signature et ses paramètres ainsi qu'une brève description :

Paramètre d'adresse¶

Adresse sur une seule ligne¶

Le adresse Le paramètre spécifie l'emplacement à géocoder. Il peut s'agir d'une chaîne contenant l'adresse sur une seule ligne, c'est-à-dire l'adresse postale, le nom de lieu, le code postal ou le POI.

Exemple : tracer une adresse en utilisant une seule ligne d'adresse¶

Adresse multi-champs¶

Alternativement, l'adresse peut être spécifiée dans un format multichamp à l'aide d'un dictionnaire contenant les différents champs d'adresse acceptés par le service de géocodage correspondant.

Afin de fournir un moyen de trouver des adresses dans de nombreux pays différents, qui peuvent utiliser différents formats d'adressage, la méthode geocode() utilise des noms de champs standardisés pour soumettre des composants d'adresse.

La propriété 'addressFields' du Geocoder spécifie les différents champs d'adresse acceptés par celui-ci lors du géocodage des adresses. Les paramètres de quartier, de ville, de sous-région et de région représentent des divisions administratives typiques au sein d'un pays. Ils peuvent avoir des contextes différents pour différents pays, et toutes les divisions administratives ne sont pas utilisées dans tous les pays. Par exemple, avec des adresses aux États-Unis, seuls les paramètres city (city) et region (state) sont utilisés pour les adresses au Mexique, le paramètre district est utilisé pour les districts (colonias) dans une ville, city pour les municipalités (municipios), et le paramètre de région pour les états (estados) L'Espagne utilise les quatre divisions administratives.

Par exemple, si addressFields d'une ressource de service de géocodage comprend des champs avec les noms suivants : Adresse, Ville, Région et Postal, alors l'argument adresse est de la forme ci-dessous.

Exemple : tracer une adresse à l'aide d'une adresse à champs multiples¶

La méthode geocode() renvoie un tableau de correspondances d'adresses potentielles (également appelées adresses candidates). Chaque adresse candidate est représentée sous la forme d'un dictionnaire Python avec les clés suivantes :

Les valeurs-clés dict sont les suivantes :

  • score représente le niveau de confiance du géocodeur dans le match, classé de 0 à 100
  • location contient l'emplacement (x, y) de la correspondance,
  • l'adresse comprend l'adresse correspondante,
  • les attributs incluent plusieurs paramètres de la propriété « Champs candidats » ci-dessus, et
  • étendue spécifie une étendue appropriée pour l'adresse correspondante.

Paramètre search_extent¶

Un ensemble de coordonnées de cadre de délimitation qui limitent la zone de recherche à une région spécifique. Ceci est particulièrement utile pour les applications dans lesquelles un utilisateur recherchera des lieux et des adresses dans l'étendue actuelle de la carte.

Vous pouvez spécifier la référence spatiale des coordonnées searchExtent, ce qui est nécessaire si la référence spatiale de la carte est différente de celle du service de géocodage sinon, la référence spatiale des coordonnées est supposée être la même que celle du service de géocodage.

L'entrée peut être soit une liste de coordonnées séparées par des virgules définissant le cadre de délimitation, soit un objet d'enveloppe JSON. La référence spatiale des coordonnées du cadre de délimitation peut être incluse si un objet enveloppe est utilisé.

Exemple : Starbucks autour de Union Square à San Francisco, Californie¶

L'exemple ci-dessous trouve et trace jusqu'à 100 emplacements Starbucks autour d'Union Square à San Francisco, en Californie. Le paramètre d'étendue est obtenu à partir du résultat de géocodage du géocodeur pour Union Square ( unionsquare['extent'] ) et transmis à la prochaine requête geocode() pour 100 emplacements Starbucks :

Paramètre d'emplacement¶

Définit un emplacement de point d'origine utilisé avec le paramètre de distance pour trier les candidats de géocodage en fonction de leur proximité avec l'emplacement. Le paramètre distance spécifie la distance radiale à partir de l'emplacement en mètres. La priorité des candidats dans ce rayon est renforcée par rapport à ceux en dehors du rayon.

Ceci est utile dans les applications mobiles où un utilisateur souhaite rechercher des lieux à proximité de sa position GPS actuelle. Les paramètres de localisation et de distance peuvent être utilisés dans ce scénario.

Le paramètre d'emplacement peut être spécifié sans spécifier de distance. Si la distance n'est pas spécifiée, la valeur par défaut est de 50 000 mètres.

L'emplacement peut être représenté avec une simple syntaxe séparée par des virgules (x,y) ou sous la forme d'un objet point JSON. Si la syntaxe séparée par des virgules est utilisée, la référence spatiale des coordonnées doit être WGS84. Sinon, la référence spatiale des coordonnées du point peut être définie dans l'objet JSON.

Exemple utilisant une syntaxe simple (WGS84) : location=-117.196,34.056 Exemple JSON avec une référence spatiale : location= < "x": -13046165.572, "y": 4036389.847, "spatialReference": < "wkid": 102100 >>

Paramètre de distance¶

Spécifie le rayon d'une zone autour d'un emplacement de point qui est utilisé pour augmenter le rang des candidats au géocodage afin que les candidats les plus proches de l'emplacement soient renvoyés en premier. La valeur de la distance est en mètres.

Si le paramètre de distance est spécifié, le paramètre d'emplacement doit également être spécifié.

Il est important de noter que contrairement au paramètre searchExtent, les paramètres d'emplacement et de distance permettent aux recherches de s'étendre au-delà du rayon de recherche spécifié. Ils ne sont pas utilisés pour filtrer les résultats, mais plutôt pour classer les candidats résultants en fonction de leur distance par rapport à un emplacement. Vous devez transmettre une valeur searchExtent en plus de l'emplacement et de la distance si vous souhaitez limiter les résultats de la recherche à une zone spécifique.

Exemple de recherche à moins de trois kilomètres de l'étendue actuelle : distance=3218,69

Paramètre de catégorie¶

Un type de lieu ou d'adresse qui peut être utilisé pour filtrer les résultats du géocodage. Le paramètre prend en charge la saisie de valeurs de catégorie unique ou de plusieurs valeurs séparées par des virgules. Le paramètre de catégorie peut être transmis dans une requête avec ou sans entrée d'adresse sur une seule ligne.

Exemple de filtrage par catégorie avec une seule catégorie :

Exemple de filtrage par catégorie avec plusieurs catégories :

Remarque : Le paramètre de catégorie n'est fonctionnel que lorsqu'il est utilisé avec une entrée d'adresse sur une seule ligne. Il ne fonctionne pas avec les adresses à champs multiples, en particulier l'adresse, le quartier, la ville, la région, la sous-région, le countryCode et les paramètres postaux.


Introduction à ArcGIS (Systèmes d'Information Géographique)

Instructeurs : Dr Beth Nagy, GISP/ Dr Mark Salling GISP
N° de cours : SIG1000
Crédit de cours: 12 heures de contact
Date(s) de la session : Provisoirement prévu pour l'automne 2021. Plus d'informations à venir bientôt.
Temps de session: 13h00 - 16h30 chaque jour

Inscription : Lorsque le prochain atelier aura été programmé, l'inscription sera disponible via Lire la suite. »

Aperçu de l'atelier

Introduction à ArcGIS présente aux participants le logiciel de cartographie et d'analyse ESRI ArcGIS. L'atelier couvre les concepts fondamentaux du SIG, les données géospatiales et la façon de cartographier et d'analyser les données au niveau de base. Les participants se familiariseront avec l'interface utilisateur graphique (GUI) d'ArcGIS, les données SIG locales, les outils SIG fréquemment utilisés et les mises en page cartographiques. Les participants ont accès au logiciel SIG ESRI, à un classeur de laboratoire et à un périphérique de stockage de données. Les participants doivent être à l'aise avec un ordinateur de bureau, une souris et Internet.

Les places étant limitées, les inscriptions anticipées sont encouragées.

Objectifs

Les participants apprennent à utiliser ArcMap, ArcCatalog et ArcToolbox et explorent comment ces applications fonctionnent ensemble pour fournir une solution logicielle SIG complète. De plus, les participants acquerront une expérience pratique avec les composants ArcGIS suivants :

  • Présentation d'ArcGIS : Capacités et applications interagissant avec l'interface contrôlant les caractéristiques d'affichage des couches de données.
  • Cartes thématiques : Types de thèmes disponibles tels que couleur ou symbole gradué, densité de points ou valeur individuelle avec des procédures à générer.
  • Produits SIG : Produisez des cartes de qualité de présentation à l'aide de modèles de carte et de mises en page avec des éléments du titre, de la légende, de la ligne nette et des logos.
  • Bases de données géographiques : Créez une géodatabase personnelle à l'aide d'ArcCatalog remplissez la géodatabase à partir de fichiers de formes, de couvertures et de bases de données, joignez et reliez les couches de données, analysez et affichez les données agrégées des tables jointes.
  • Importation de données spatiales et d'attributs : Importez des données spatiales à partir d'un fichier d'échange de couverture, définissez et modifiez les projections cartographiques, téléchargez les données d'attributs spatiaux à partir des sites Web Geospatial One-Stop du gouvernement américain et American Factfinder du Census Bureau, puis importez-les dans le SIG.
  • Numérisez et modifiez les caractéristiques spatiales : Utilisez des outils de numérisation « tête haute » pour créer de nouvelles caractéristiques spatiales de points, de lignes et de polygones. Modifiez le géoréférencement des entités spatiales existantes en utilisant une photographie aérienne comme guide.
  • Géocoder : Créez des emplacements de points de coordonnées x,y en fonction de la méthode d'interpolation à l'aide d'une base de données d'adresses postales ou par une méthode de polygone telle que le code postal.
  • Requêtes de données d'attributs et traitement spatial : Sélectionnez des entités par requêtes attributaires, ajoutez un champ et calculez ou mettez à jour les valeurs de champ, coupez, dissolvez et ajoutez des couches.
  • Analyse spatiale: Interrogez et sélectionnez par emplacement en utilisant les relations spatiales de l'intérieur, contiennent des caractéristiques spatiales d'intersection, etc. tampon, puis interrogez spatialement pour localiser les caractéristiques dans les zones tampons.
  • Utilisation de jeux de données locaux : Les participants peuvent télécharger des ensembles de données SIG pour la région du comté de Cleveland/Cuyahoga qui seront utilisés pendant l'atelier et pourront être utilisés en dehors des cours pour des projets futurs.
Public

Cet atelier est ouvert à tous.

Conditions préalables

Il n'y a pas de prérequis pour cet atelier. Aucune expérience de la cartographie de bureau ou de la technologie SIG n'est requise, mais les personnes inscrites doivent savoir comment utiliser un logiciel Windows.

Frais de cours et méthodes de paiement

Le Levin College de la CSU offre une alternative locale et moins coûteuse aux ateliers similaires proposés ailleurs. Le coût pour chaque participant à l'atelier de trois jours est de 495 $. Les tarifs réduits suivants sont disponibles : Tarif étudiant CSU - 295 $, Tarif Alumni CSU : 395 $, Tarif de groupe de 3 ou plus (de la même organisation) : 395 $ (par personne).

  • Pour vous inscrire, veuillez utiliser [email protected]).
  • Si vous êtes un employé de la CSU, vous pourrez peut-être utiliser les fonds de développement du corps professoral/du personnel pour payer cet atelier. Le formulaire peut être obtenu à partir de la page Formulaire des avantages des ressources humaines de la CSU. Veuillez envoyer une copie du formulaire dûment rempli à la Division de la formation continue et approfondie à [email protected] ou UR 141. Après cela, veuillez compléter l'inscription sur [email protected]). Cliquez ici pour plus d'informations sur la politique de remboursement de la Cleveland State University.

ANNULATIONPOLITIQUE

La Cleveland State University se réserve le droit d'annuler un atelier et de rembourser les frais de l'atelier en cas de nombre insuffisant d'inscrits.

Des questions

Si vous avez des questions sur cet atelier, veuillez contacter Sharon Bliss ([email protected]).

Développement professionnel

Le Maxine Goodman Levin College of Urban Affairs propose une large gamme de cours, d'ateliers et de séminaires conçus sur mesure. Voir la liste des cours de développement professionnel pour l'horaire de ce semestre.


Géocodage d'adresse : options pour la communauté UC Berkeley

Un certain nombre d'étudiants et de chercheurs d'UCB ont interrogé le D-Lab sur les outils de géocodage des adresses postales. Cette variété de départements et d'écoles que représentent ces chercheurs - y compris la santé publique, l'ESPM (sciences, politiques et gestion de l'environnement), la musique, l'histoire et la sociologie, entre autres - indiquent l'utilité généralisée du géocodage. En réponse à cet intérêt, le D-Lab prend un certain nombre de mesures pour aider la communauté UCB avec ses besoins de géocodage. Ce semestre, nous proposons deux ateliers sur le géocodage que vous pouvez consulter sur notre site Web : 1) Introduction au géocodage et à la cartographie (6 avril 2015), qui met l'accent sur la programmation et le Data Science Toolkit (DSTK), et 2) Adressage du géocodage avec ArcGIS, qui se concentre sur le géocodage sans programmation (21 avril 2015). Dans le cadre de nos services de conseil, D-Lab propose des consultations individuelles sur le géocodage et d'autres méthodes et outils d'analyse spatiale. De plus, grâce au financement du professeur Rachel Morello-Frosch, qui fait partie de la School of Public Health & ESPM, le D-Lab a mis en place un serveur sécurisé pour aider les chercheurs d'UCB à géocoder les données à accès restreint.

Vous trouverez ci-dessous un aperçu des options logicielles de géocodage et de géocodage pour vous aider à démarrer. Contactez le D-Lab si vous avez des questions.

Qu'est-ce que le géocodage

Pour ceux qui ne connaissent peut-être pas le géocodage, voici une très brève introduction. Le géocodage est le processus de calcul des coordonnées géographiques d'une référence de lieu telle qu'un nom de ville, un code postal ou une adresse postale. Je me concentrerai sur le géocodage d'adresses bien que les méthodes de géocodage d'autres types de lieux soient similaires. Le géocodage des adresses nécessite (1) un fichier d'entrée qui contient la liste des adresses à géocoder, (2) une base de données de référence d'entités géographiques, telles que les rues avec des plages d'adresses, avec lesquelles ces lieux sont comparés, et (3) un logiciel pour déterminer la correspondance entre ces deux, par exemple, si l'adresse d'entrée peut être localisée dans la base de données de référence.

La sortie du géocodage est un point pour chaque adresse ou lieu d'entrée pour lequel une correspondance a été trouvée, généralement exprimée en latitude et longitude. La plupart des géocodeurs généreront également des métadonnées sur le processus de correspondance, y compris la façon dont le logiciel a analysé et normalisé le lieu d'entrée, s'il a trouvé ou non une correspondance pour ce lieu dans la base de données de référence, et la qualité de cette correspondance. Pour le géocodage d'adresse, le processus de correspondance est généralement un processus d'interpolation linéaire où les coordonnées de l'adresse d'entrée sont estimées à l'aide d'une base de données de référence des axes de rue pour lesquels les plages d'adresses sont connues pour chaque segment de rue et, dans de nombreux cas, pour le côté de la rue comme bien. Une hypothèse clé de cette approche est que les parcelles sont uniformément réparties le long d'un segment de rue, par ex. sont de la même taille et numérotés de manière cohérente. Dans l'image ci-dessous, le logiciel de géocodage suppose neuf parcelles de taille similaire sur le côté gauche de la rue entre 5640 et 5656 Spring Garden Rd et donc l'emplacement de 5650 serait proche du point à mi-chemin sur le segment de ligne pour cette plage d'adresses.

Pourquoi géocoder ?

Il y a trois raisons principales pour géocoder des adresses et d'autres lieux nommés :

  1. pour afficher des lieux sur une carte,
  2. pour déterminer les relations entre les lieux, telles que la distance, la direction ou le schéma de dispersion, et
  3. utiliser la localisation géographique pour associer des lieux à d'autres données référencées géographiquement telles que les données démographiques du recensement, les transactions de vente, les emplacements des établissements historiques, les concentrations de pollution, etc.

Pour un exemple détaillé, bien que daté, d'une application de santé publique, voir le Harvard Public Health Geocoding Project.

Termes connexes

C'est une bonne idée de maîtriser un ensemble de termes connexes afin de pouvoir rechercher de l'aide ou des documents de référence plus efficacement.

  • Géocodage par lots - géocodage de plusieurs adresses en même temps.
  • Géocodage inversé - détermination du nom de lieu, du code postal ou de l'adresse d'un emplacement spécifié par des coordonnées géographiques.
  • Correspondance d'adresses - un synonyme de géocodage d'adresses.
  • Géolocalisation - déterminer les coordonnées géographiques d'un objet ou d'une caractéristique sur ou près de la surface de la terre, par exemple avec le GPS.
  • Géoréférencement - rendre un objet non géospatial, comme une carte ou une photographie numérisée, géospatial en référençant des points qu'il contient à des emplacements géographiques connus.

Géocoder plusieurs adresses

Il est assez facile de géocoder une adresse. Vous pouvez mettre l'adresse dans la barre de recherche de Google Maps et l'URL renvoyée contiendra la longitude et la latitude de l'adresse géocodée. Cependant, cette approche ne s'adapte pas bien à plusieurs adresses. Pour plus d'un, vous aurez besoin d'utiliser un géocodeur d'adresse.

Qu'est-ce qu'un géocodeur d'adresses ?

Un géocodeur d'adresse est un logiciel qui :

  1. analyse les adresses d'entrée en composants identifiables, tels que le nom et le numéro de rue, la ville, l'état et le code postal,
  2. fait correspondre les adresses d'entrée à une base de données de référence d'entités spatiales (par exemple, des rues ou des parcelles) ayant ces mêmes composants identifiables
  3. détermine les coordonnées géographiques des adresses d'entrée mises en correspondance,
  4. évalue (ou note) les matchs,
  5. génère des coordonnées pour les adresses appariées ainsi que des métadonnées qui décrivent la correspondance.

Les logiciels de géocodage se présentent sous plusieurs formes. Il peut s'agir de l'une des fonctionnalités d'un progiciel de bureau installé localement sur votre ordinateur, tel qu'ArcGIS ou QGIS. Il peut s'agir d'un outil de cartographie comme Google Earth Pro (maintenant gratuit !) ou d'un service en ligne comme le US Census Geocoder. Il peut s'agir d'un service en ligne avec une interface de programmation d'applications (ou API) qui permet d'écrire un programme en R, Python ou Javascript, entre autres langages, pour géocoder une ou plusieurs adresses. L'API Google Geocoding, Mapquest Open Geocoding Service, Photon et Data Science Toolkit (DSTK) sont tous des exemples de géocodeurs en ligne populaires avec des API. Geopy est une bibliothèque Python permettant d'accéder par programmation à plusieurs API de géocodage populaires. GGmap est un package R pour faire la même chose.

Base de données de référence du géocodeur

La base de données de référence est un composant extrêmement important du géocodeur. C'est la couverture géographique, l'exhaustivité, l'actualité et la résolution spatiale sont les principaux déterminants de la qualité de la sortie - ainsi que le coût du géocodeur. Une table de recherche, parfois appelée localisateur d'adresses, est utilisée par le géocodeur pour identifier les composants de données, ou les champs, qui sont communs aux adresses d'entrée et à la base de données de référence, par exemple, le nom et le numéro de rue, la ville, l'état et le code postal , et activer le processus de correspondance. La table de recherche peut fonctionner en arrière-plan - sur le backend - et l'utilisateur final peut ne pas en être conscient. Il est principalement important car il détermine la manière dont les adresses d'entrée doivent être formatées pour que le géocodeur fonctionne. Si un géocodeur permet l'entrée d'une base de données de référence fournie par l'utilisateur, le géocodeur disposera également d'un logiciel pour créer une table de recherche personnalisée. Ce niveau de personnalisation augmente considérablement les fonctionnalités d'un géocodeur mais aussi sa complexité.

La base de données de référence est souvent fournie avec le logiciel de géocodage - à la fois en ligne ou dans un logiciel de bureau local. Dans d'autres configurations, le logiciel de géocodage peut être installé localement sur votre ordinateur mais la base de données de référence peut être une ressource en ligne. Des exemples de ce type de configuration incluent le plug-in QGIS MMQGIS, qui est lié au géocodeur Google Maps, et ArcGIS Desktop qui est lié par défaut au service de géocodage mondial ArcGIS Online. QGIS et ArcGIS peuvent être configurés pour utiliser une base de données de référence locale bien que cette approche soit beaucoup plus robuste et sophistiquée dans ArcGIS.

Nettoyage et normalisation des adresses

Le processus de géocodage commence toujours par un ensemble d'adresses à géocoder. Du point de vue de l'utilisateur, l'étape la plus importante, la plus fastidieuse et la plus longue du processus de géocodage est le nettoyage des données. Cela inclut des tâches telles que :

  1. Réduire les adresses à leurs composants de base tels que le numéro de rue et d'amp, la ville, l'état, le code postal et supprimer les éléments non essentiels tels que la suite ou le numéro d'appartement.
  2. Standardiser le format des composants de l'adresse, par exemple, l'autoroute devient HWY, SO devient S. (sud), supprimez les espaces supplémentaires, etc.
  3. Standardiser le format des adresses avant le géocodage, par exemple, une adresse par ligne avec/sans colonnes délimitées et en-têtes de colonnes.

Le format d'adresse standardisé est spécifique au géocodeur et cette étape ne doit donc pas être entreprise avant d'avoir sélectionné votre géocodeur et d'avoir testé un petit échantillon de vos adresses avec lui pour vous assurer que vous avez identifié le format d'adresse d'entrée spécifique. Si vous avez beaucoup d'adresses, vous devrez peut-être utiliser un logiciel comme MS Excel ou écrire un court programme informatique ou un script pour aider à automatiser le processus de nettoyage.

Sortie de géocodage

Bien que les coordonnées géographiques soient généralement renvoyées par un géocodeur, le système de coordonnées peut varier. La plupart des géocodeurs en ligne renvoient des coordonnées géographiques référencées à un système de coordonnées basé sur le système de référence WGS84 ou NAD83. Dans la plupart des cas d'utilisation, mais pas tous, la différence entre les données dans ces deux systèmes de coordonnées sera négligeable. Nous vous avertissons d'être conscient du problème et de considérer son impact sur votre recherche. Dans la mesure du possible, vous devez identifier et documenter le système de coordonnées utilisé par vos données géographiques numériques. De plus, les données ponctuelles en coordonnées géographiques doivent presque toujours être converties en un système de coordonnées projetées avant d'être cartographiées ou utilisées pour déterminer les relations spatiales ou les associations avec d'autres ensembles de données des points. Si vous n'êtes pas familier avec les projections cartographiques et les systèmes de coordonnées, nous vous suggérons de vous renseigner sur ce sujet avant de post-traiter vos adresses géocodées. Une bonne référence de base que vous devriez pouvoir trouver en ligne est le document ESRI, Understanding Map Projections.

La plupart des géocodeurs renvoient un score ou une valeur de confiance qui indique la force de la correspondance entre l'adresse d'entrée et la base de données de référence. Par exemple, le score peut aller de 0 à 1, où une valeur de 1 indique une forte correspondance. Cependant, une forte correspondance avec la base de données de référence n'est pas nécessairement une forte correspondance sur le terrain, surtout si la qualité de la base de données de référence est médiocre. D'un autre côté, un score de confiance faible, disons 0,75, peut être une correspondance fantastique sur le terrain et seulement une mauvaise correspondance avec la base de données de référence si, par exemple, le nom de la rue saisi a été mal orthographié mais correspondait correctement. Dans ce cas, le score le plus bas indique l'incertitude du géocodeur en raison du problème d'orthographe et n'est pas un problème de précision de localisation. Un géocodeur peut également fournir des informations supplémentaires sur la qualité de sortie. Par exemple, une adresse géocodée peut avoir une précision au niveau de l'adresse, de la rue ou de la ville où l'adresse est la plus souhaitable. Le point important ici est qu'un chercheur doit soigneusement examiner et comprendre le résultat du géocodage et évaluer s'il répond aux besoins de la recherche.

La qualité de sortie du géocodage dépendra des facteurs suivants :

  1. le détail, la précision et l'actualité de la base de données de référence du géocodeur,
  2. l'exactitude, l'exhaustivité et la standardisation des adresses d'entrée,
  3. la sophistication de l'analyse d'adresse du géocodeur (c'est-à-dire la capacité d'analyser des composants d'adresse non standard, de gérer les fautes d'orthographe et les abréviations, etc.),
  4. la sophistication de l'algorithme d'appariement du géocodeur, et
  5. l'examen du résultat par le chercheur, avec révision des adresses non appariées et itération au besoin.

La normalisation des adresses, la sélection du géocodeur, l'examen des résultats, la révision et l'itération sont les parties du processus que le chercheur peut contrôler. Avoir accès à un géocodeur adapté avec une base de données de référence de haute qualité est beaucoup plus difficile.

Conseils pour traiter un grand nombre d'adresses (

  • Testez le processus sur un petit échantillon d'adresses pour comprendre quels types d'adresses peuvent ne pas correspondre ou avoir de mauvaises correspondances et pourquoi. Cela vous aidera également à déterminer le type de format de sortie et de métadonnées du géocodeur.
  • Prétraitez vos adresses pour standardiser le formatage.
  • Triez vos adresses par état, ville, code postal, car cela accélérera le processus de géocodage.
  • Fournissez toutes les informations d'adresse que vous connaissez. Par exemple, si toutes les adresses sont dans CA, assurez-vous que CA est répertorié comme état pour toutes les adresses.
  • Morceau d'adresses d'entrée dans des fichiers plus petits, par ex. de 25 000 adresses chacune, pouvant être traitées de manière séquentielle.
  • Évaluez la qualité de sortie du géocodage avec des statistiques récapitulatives simples pour voir si la sortie répond à vos besoins de recherche. Les statistiques récapitulatives peuvent inclure :
  • nombre d'adresses appariées vs non appariées,
  • nombre d'adresses appariées à chaque score ou plage de niveau de confiance, par exemple 0,75 à 0,85, 0,85 à 1.
  • Examinez un échantillon aléatoire de votre sortie sur une carte avec les données de référence pour obtenir une impression visuelle de la qualité de la sortie. Comparez quelques-uns de ces résultats à ce que vous obtiendriez de Google Maps.
  • Tenez compte du format de sortie du géocodage et du format dans lequel vous aurez besoin de ces données pour une analyse plus approfondie.

Considérations relatives au géocodage

Avant de pouvoir sélectionner un géocodeur, vous devez identifier les besoins de votre projet. Voici quelques-uns des facteurs dont vous devrez tenir compte.

  1. Quel niveau de spécificité de localisation avez-vous besoin de votre sortie - bloc de rue, dans quelques maisons, sur la propriété, sur la structure ?
  2. De quel niveau d'exhaustivité avez-vous besoin ? Avez-vous besoin de géocoder toutes vos adresses ou 90 % suffiront-ils ?
  3. Quel est votre budget de géocodage ? Essayez-vous de le faire gratuitement ? En raison de sa valeur d'intelligence d'affaires et des coûts du système, un service de géocodage payant peut être très coûteux. Par exemple, il en coûterait 40 $ pour géocoder mille ou 4 000 $ pour géocoder un million d'adresses à l'aide du géocodeur ArcGIS Online.
  4. Connaissez-vous et souhaitez-vous utiliser un outil de géocodage spécifique, comme ArcGIS ou QGIS, ou un langage de programmation, comme R ou Python ?
  5. What is the geographic scope of your addresses - are they all in the U.S? Most free geocoders have limited geographic coverage outside of the U.S.
  6. What is the temporal scope of your addresses? For example, are they gathered from historical documents or are they from 2010 survey data? Consider that the geocoder’s reference database will reflect a specific time period, say 2010. Streets developed with new homes after that period will not be in the database. Changes over time, e.g., properties replaced by freeways or address range changes on streets, will not be captured in the database. You may need to create a custom reference database or use several developed at different times.
  7. Are you geocoding restricted access data? If this is the case you may not be able to use an online geocoding service (unless it can meet your security and price point needs). You may instead need to use local geocoding software with a local reference database. This greatly limits your options.

Which Geocoder to Use?

Below is a table of characteristics of popular geocoders that I would recommend to the UCB community. This table is not comprehensive and it may be out of date as the terms of use, particularly for the online services, change frequently. Moreover, new online geocoding tools are continually being released. However, it indicates the key factors to consider and the relative merits of listed options.

Address Geocoding: Some Options for the UCB Community

Recommendations

My specific geocoder recommendations are as follows. If you can use a Google geocoder you should. In my opinion, Google’s geocoding output quality, speed, currency, and geographic scope are unmatched. It is a bit tricky to get the output in a simple CSV file without programming but you can do it via the following workflow: Input addresses to Google Earth Pro > Output to KML > Import KML to geojson.io > Save as CSV.

If you cannot use the Google Geocoder because you have many more than the 2,500 addresses that can be processed per day, you can try the US Census Geocoder. The Census Geocoder is super simple to use and it has the added benefit of outputting Census FIPS codes - making it easier to link your addresses to census data. If you cannot use an online geocoder due to restrictions on the use of your data or if you have more addresses than you can reasonably geocode using the Google or Census geocoders then you should try the ESRI ArcGIS geocoder. It’s fast, accurate, customizable, robust, outputs rich metadata, has a user friendly interface, and, if used with the ESRI streets database, is free to the UCB Community for research & educational uses.

You can install the ArcGIS software on your personal computer by requesting a license via the UCB Geospatial Innovation Facility (GIF) website. If you are installing ArcGIS on a campus computer talk to your unit’s system administrator for information on how to proceed. Note, ArcGIS runs on a Microsoft Windows-based PC or on a Mac with Windows installed via Bootcamp, Parallels, or VMFusionWare. ArcGIS is memory intensive software and you may need to run it on a computer with more memory and processing power than what you have in your personal computer, especially if you are running it on a Mac. If this is the case, you can try the GIS workstation in the D-Lab or UCB Earth Sciences & Map Library. Another big benefit to using ArcGIS is that ESRI provides a ton of online documentation for this tool and on geocoding in general.

The ArcGIS Desktop geocoder uses the ArcGIS Online World Geocoding service as the default reference database. This service requires that you first register for an ESRI ArcGIS Online account and either buy ESRI credits (which translate to .004 per address at the time of this writing) or use free introductory offer credits. This approach is not viable for geocoding more than approximately 1,000 addresses unless you wish to pay for the credits. A solid and extremely useful free alternative is to access or obtain a copy of the North American Streets data from the UCB Maps Library or the D-Lab. This will give you a local geocoding service with superfast, robust geocoding of unlimited addresses, on the order of 1,000,000 per hour. Unfortunately, the most recent version of the NA Streets data available to the UCB campus community is circa 2009 and thus will not include addresses for housing developments created post-2009. This is the main disadvantage to the ArcGIS geocoder. One alternative is to use a hybrid approach where you geocode most of your addresses in ArcGIS and then use the Google Geocoder for those addresses which ArcGIS cannot match.

If you want to use ArcGIS with non-U.S. or historical addresses you will need to find or create (e.g., digitize from historical maps) your own reference database first. If you are not a member of the UCB community and/or don’t have an ArcGIS license and are looking for a free geocoding service, try the Data Science Toolkit or one of the geocoding options based on OpenStreetMap (see table above). These are all solid tools if you cannot use the Google Geocoder though I prefer DSTK due to it’s speed and ease of use.

Beyond Address Geocoding

For those of you who want to map your geocoded addresses, ArcGIS/ArcMap and QGIS are great desktop tools, CartoDB is a great online mapping tool, and R and Python offer mapping functionality via spatial packages and libraries. CartoDB is also a great tool if you have a dataset that has place name references (as opposed to street addresses) that you want to very easily geocode and map or export to CSV, KML, or Shapefile.

If you want to link your geocoded addresses to census data you need to get the Census FIPS code for each address. If you used the Census Geocoder you can get this automatically, otherwise it requires a bit of work. You can get FIPS codes programmatically via the FCC Census Block Conversions API. In ArcGIS, you can get these using the spatial intersect tool (not Spatial Join as that could be too slow) to join the FIPS codes in census tract, block group, or block level geographic data, which you can download here, with your geocoded addresses. Note, you must first make sure your two data sets have the same spatial reference system (i.e. map projection) before intersecting. D-Lab is planning a workshop for May 2015 on linking points to census data so keep your eyes on our calendar.

Moving forward, ArcGIS offers an unparalleled toolkit for spatial analysis of your geocoded addresses. That said, there are free and open source, or FOSS, options for spatial analysis including QGIS, a very popular ArcGIS alternative, and spatial packages in R and Python. I also highly recommend that you checkout PostGIS, an extension to PostgreSQL for creating a spatially-enabled database, as an alternative spatial analysis environment to ArcGIS. As a detailed example of working with both ArcGIS and PostGIS, the Harvard School for Geographic Analysis published a great blog post on geocoding 53 million addresses.

Obtenir de l'aide

Please sign up for a consult with me via the D-Lab web site if you have geocoding questions. Check out the D-Lab website Trainings page and join our mailing list if you want be alerted to upcoming geocoding workshops. You can also reach out to Susan Powell, the UCB Maps & GIS librarian, the GIF, or BIDS (Berkeley Institute for Data Science) for consulting on geocoding, GIS, and related topics.


Voir la vidéo: Yksinkertainen tapa purkaa kaikki liitteet Mac Outlookista 2020