Comment créer facilement des cartes d'état et de comté dans R

À l’Urban Institute, nous cherchons toujours des moyens de visualiser les données. Que je recherche des tendances spatiales ou crée des graphiques pour un rapport, je crée souvent une carte. Créer des cartes pour explorer et communiquer la distribution géographique des données doit être simple et amusant, mais souvent difficile. Aaron Williams, Kyle Ueyama et moi avons créé un package R, urbnmapr, pour résoudre ce problème et rendre la cartographie de base plus accessible à Urban.

Chez Urban, nous créons fréquemment des cartes des États-Unis à inclure dans des articles et des rapports de blogs. Quelques éléments de base sont nécessaires avant qu’une carte des États-Unis soit prête. Par exemple, l’Alaska et Hawaï sont généralement redimensionnés et décalés pour pouvoir apparaître à côté des États-Unis contigus. Les données géographiques peuvent également être volumineuses, encombrantes et apparaître sous plusieurs formats différents, tels que fichier de formes, GeoJSON ou KML (Keyhole Markup Language). Ces fichiers doivent souvent être convertis dans un certain format afin de mieux fonctionner avec l’outil logiciel de visualisation de données de votre choix. J'avais besoin de fichiers de formes que je pourrais utiliser dans R, en particulier avec ggplot2. Au fur et à mesure que je dessinais de nouvelles cartes, je déplaçais constamment des fichiers et répliquais mes propres efforts alors que tout ce que je voulais, c'était créer une carte simple.

Notre forfait: urbnmapr

urbnmapr est le premier package R développé par et pour le personnel urbain. Il vise à simplifier et à normaliser le processus de création de cartes choroplèthes d’États et de comtés dans R. Les cartes choroplèthes, comme dans l’exemple ci-dessous, masquent différentes unités géographiques (par exemple, pays, états ou comtés) en fonction des valeurs des données. Au Centre de politique de financement du logement urbain, nous voulions voir comment la part des prêts Ginnie Mae variait selon les États:

Le package R permet aux utilisateurs de charger dans des fichiers de formes dotés d'identificateurs géographiques permettant la fusion avec d'autres données, avec une seule ligne de code. Associé au paquet thématique de l’Urban Institute d’Aaron Williams et au guide de cartographie d’Urban, cet outil facilite la création de cartes de style urbain comme aides à la recherche ou comme produits finaux dans une publication. Même les utilisateurs ayant une expérience limitée en programmation ou en cartographie peuvent rapidement créer des cartes personnalisées en R.

Faire votre première carte

Pour utiliser le paquet, commencez par l’installer à partir de Github (si vous n’avez pas encore installé devtools, assurez-vous d’abord installer.packages ('devtools')):

À partir de là, vous pouvez facilement charger et tracer les fichiers de formes dont vous avez besoin à l'aide de ggplot2.

Fusion de vos données

Le jeu de données d'état comprend les noms, les abréviations et les codes FIPS (Federal Information Processing Standards), des identificateurs numériques uniques pour chaque comté et chaque état. L'ensemble de données de comté comprend toutes les variables d'état, ainsi que les noms de comté et les codes FIPS, ce qui facilite la fusion avec les données avec lesquelles vous travaillez, qu'elles incluent des noms ou des codes. Avec seulement quelques lignes de code supplémentaires, vous pouvez créer une carte choroplète personnalisée.

Avantages de la cartographie en R

Il y a quelques caractéristiques que j'aime beaucoup à propos de ce paquet et de la création de cartes dans R en général:

1. Données rangées. L'utilisation de données spatiales ordonnées ouvre des portes pour une discussion de données rapide et facile. Supposons que vous souhaitiez cartographier chaque comté d'un État. En utilisant la bibliothèque R (dplyr), vous pouvez facilement créer une carte de la Californie:

Il est également facile d’utiliser toutes les fonctionnalités de superposition de ggplot2. Pour les cartes de comté, le style urbain standard consiste à ajouter une bordure blanche plus épaisse autour des États pour faciliter la lecture des cartes:

2. Code réutilisable. Faire des cartes par programme fait gagner du temps. Mon équipe met constamment à jour nos données. Ainsi, lorsque de nouvelles données nous parviennent, nous pouvons les entrer rapidement et produire une nouvelle carte en quelques secondes.

J'ai utilisé des cartes que j'ai réalisées avec urbnmapr dans un récent rapport que j'ai écrit avec mes collègues du Centre de politique de financement du logement. Nous recherchions les comtés des États-Unis qui comptent le plus grand nombre de maisons vendues à 70 000 $ ou moins. Lors de la rédaction du rapport et de la réception des commentaires, nous avons modifié nos critères et nos seuils de vente. Chaque fois que nous avions de nouvelles données, tout ce que je devais faire était de changer quelques lignes de code et je pouvais instantanément avoir une nouvelle carte prête à l'emploi.

3. Disposition réutilisable. Il est facile de produire et d’exporter des cartes dont la disposition et la taille sont identiques. Je souhaite souvent créer plusieurs cartes presque identiques ou adaptées à un certain modèle, comme une diapositive PowerPoint. Comme j'utilise les mêmes données géographiques uniformes et que je peux spécifier chaque fonctionnalité de la carte dans mon code, je peux exporter des cartes conçues pour répondre à mes besoins.

4. Paquet extensible. Notre solution basée sur des packages nous permet d’améliorer sans cesse les outils que nous pouvons partager. Nous avons déjà apporté plusieurs améliorations depuis notre première version d’urbnmapr et la structure du progiciel permet de prendre en compte les suggestions des autres chercheurs d’Urban et de les améliorer. Nous avons déjà ajouté des territoires américains et des données supplémentaires pour l’étiquetage des États et des villes sur la base des commentaires des chercheurs. À l'avenir, nous espérons élargir les niveaux géographiques que nous proposons et incorporer de nouveaux formats de données spatiales (tels que les «fonctionnalités simples»).

La cartographie peut être un processus difficile et laborieux, en particulier lorsque les données et la conception changent constamment. Notre paquet R est ouvert à tous, et tout le code est accessible au public sur GitHub. J'espère que cela réduira la barrière à l'entrée pour les personnes qui souhaitent analyser et partager des informations à partir de données géospatiales.

-Sarah Strochak

Voulez-vous en savoir plus? Inscrivez-vous à la newsletter Data @ Urban.