Suite

Exécuter Grass7 dans un environnement conda ?

Exécuter Grass7 dans un environnement conda ?


J'ai la distribution Python d'Anaconda (Python 3.4.3 :: Anaconda 2.1.0 (64 bits)) installé sur Ubuntu 14.04. Je voudrais créer un environnement conda pour exécuter Grass 7.

Pour ce faire j'ai utilisé :

conda create -n grassenv python=2 source activer grassenv conda installer wxpython

Quand je coursherbe70du terminal, il ouvre le Grass Shell et donne un messageLancement GUI en arrière-plan, veuillez patienter…mais n'ouvre pas l'interface graphique. Existe-t-il un moyen de faire fonctionner Grass & de travailler dans un environnement conda ?


Qu'essayez-vous de faire exactement et quel est votre système d'exploitation (Windows, Linux, Mac OS X) ?

  1. Si vous souhaitez utiliser la coquille Grass (herbe70), vous n'avez pas besoin de créer un environnement conda siherbe70est sur votre chemin.

  2. Si vous souhaitez utiliser les modules Pythonherbe.scriptou alorsherbe.pygrassen Anaconda/Python, vous avez deux solutions :

    une) appelez Anaconda depuis la coquille d'herbe.

    à partir de grass.script importer le noyau en tant que g

    b) appelez Grass depuis le shell Anaconda : vous devez d'abord définir des variables d'environnement (regardez Travailler avec GRASS sans le démarrer explicitement et de nombreuses questions/réponses sur GIS SE).

    importer grass.script en tant qu'herbe

Impossible d'exécuter "conda activate" à partir du pipeline Jenkins

J'ai pensé à utiliser des environnements virtuels avec Conda dans mes pipelines Jenkins qui avaient besoin d'Ansible, en faisant en sorte que tous les nœuds utilisent le même environnement, ansible-env pour exécuter des playbooks. Bien que le processus semble assez simple, je ne parviens pas à appeler conda activate ansible-env , car cela entraîne l'erreur suivante :

Voici le code que j'utilise pour l'activer. assez basique

J'ai exécuté conda init --system sur le nœud de construction en tant qu'utilisateur Jenkins, puis j'ai redémarré. Pas de changement.

J'ai passé beaucoup de temps à essayer de trouver une solution sur Google, mais tout ce que j'ai essayé n'a pas fonctionné.

Ce que j'ai tenté :

  • J'ai essayé d'exécuter sh("conda init bash") dans le pipeline.
  • Exécution. /home/jenkins/miniconda3/profile.d/conda.sh depuis le pipeline.
  • Assurez-vous que le répertoire bin pour miniconda3 est défini dans $PATH.
  • Exécutez dpkg-configure dash pour vous assurer que /bin/bash est le shell par défaut sur le nœud.
  • J'ai essayé de rechercher le fichier /home/jenkins/.bashrc
  • Appel de l'exécutable conda via le chemin absolu.
  • J'ai essayé d'utiliser la source ansible-env ou d'activer ansible-env sans conda .

Je suis presque sûr que le problème a à voir avec les lignes suivantes ajoutées à

/.bashrc de l'utilisateur jenkins après avoir exécuté conda init --system , mais n'étant toujours pas accessible depuis ce même utilisateur lorsqu'un travail est en cours d'exécution. Malheureusement, j'ai heurté un mur et je ne sais pas où aller à partir d'ici.

REMARQUE: Veuillez ne pas suggérer de passer à VirtuanEnv à moins qu'il n'y ait une raison spécifique pour laquelle Conda ne fonctionnera pas avec Jenkins. Je suis au courant de cet itinéraire, mais je suis allé avec conda pour. les raisons.


Tâche cron à exécuter sous l'environnement virtuel conda

J'ai configuré un environnement virtuel Python Anaconda et si j'exécute mon projet alors que cet environnement virtuel est activé, tout fonctionne très bien.

Mais j'ai une tâche cron configurée pour l'exécuter toutes les heures. J'ai redirigé la sortie vers un journal car il ne fonctionnait pas correctement.

J'obtiens cette erreur dans le cronlog.log :

Cela indique que la tâche cron n'exécute pas le fichier sans l'activation de l'environnement virtuel.

Pour y remédier, j'ai ajouté une ligne au fichier /home/user/.bash_profile :

Maintenant, lorsque je me connecte, l'environnement est activé automatiquement.

Cependant, le problème persiste.

J'ai essayé une autre chose. J'ai modifié la tâche cron (et j'ai également essayé cela dans le fichier bash exécuté par la tâche cron) pour activer explicitement manuellement l'environnement à chaque exécution, mais en vain :

Bien sûr, rien de ce que j'ai essayé n'a résolu le problème. Je ne connais vraiment rien à Linux alors peut-être qu'il y a quelque chose d'évident que je dois changer.

Alors, y a-t-il de toute façon à spécifier que la tâche cron doit s'exécuter sous un environnement virtuel ?


Comment puis-je exécuter un script python à l'aide d'Anaconda à partir de la ligne de commande ?

Remarque : je suis nouveau sur Python et je n'ai jamais vraiment utilisé de modules externes comme ceux répertoriés ci-dessous, alors n'hésitez pas à me faire savoir s'il y a quelque chose que je pourrais faire mieux pour que mon programme soit opérationnel.

Je travaille actuellement avec un programme python (2.7.x) qui nécessite l'utilisation de la pile SciPy. Le développeur précédent du programme utilisait Anaconda pour accéder à tous les modules externes. Dans mon cas, je dois pouvoir exécuter l'intégralité du programme avec une seule commande. Par exemple:

Exécutera myFile.py (qui a les importations suivantes) :

D'après ce que j'ai compris, Anaconda est un IDE qui vous oblige à exécuter du code de la même manière que Visual Studios (c'est-à-dire un bouton "Exécuter"). Alors ma question est :

Y a-t-il un moyen pour moi de le faire directement à partir de la ligne de commande?

Remarque : la raison pour laquelle je spécifie l'utilisation d'Anaconda au lieu d'utiliser uniquement les modules externes eux-mêmes est que sur le site Web de SciPy, il est constamment mentionné qu'il est plus simple d'utiliser une distribution python scientifique comme Anaconda ou Python (x, y). En fin de compte, je suis d'accord avec toute solution qui me permet d'exécuter mon programme avec les importations ci-dessus.


La simulation du changement d'occupation du sol à l'aide d'un environnement informatique distribué ☆

Des modèles informatiques sont utilisés en écologie du paysage pour simuler les effets des décisions humaines d'utilisation des terres sur l'environnement. De nombreux facteurs socio-économiques et écologiques doivent être pris en compte, nécessitant l'intégration de données multidisciplinaires spatialement explicites. Le Land-Use Change Analysis System ou LUCAS a été développé pour étudier les effets de l'utilisation des terres sur la structure du paysage dans des zones telles que le bassin fluvial de Little Tennessee dans l'ouest de la Caroline du Nord et la péninsule olympique de l'État de Washington. Ces effets comprennent le changement de la couverture terrestre et l'adéquation de l'habitat des espèces. Les couches cartographiques utilisées par LUCAS sont dérivées d'images de télédétection, de cartes de recensement et de propriété, de cartes topologiques et de sorties de modèles économétriques. Un système d'information géographique (SIG) du domaine public est utilisé pour stocker, afficher et analyser ces couches cartographiques. Une version parallèle de LUCAS (pLUCAS) a été développée en utilisant la machine virtuelle parallèle (PVM) sur un réseau de postes de travail donnant un facteur d'accélération de 10,77 avec 20 nœuds. Un modèle parallèle est nécessaire pour des simulations sur de plus grands domaines ou pour des cartes avec une résolution beaucoup plus élevée.


Discussion

Cette étude a examiné si les caractéristiques de l'environnement bâti du quartier mesurées objectivement sont associées à l'AP chez les personnes âgées et a évalué si ces relations différaient entre celles avec et sans LLOA. Les résultats ont montré que les distances jusqu'à des ressources de soins de santé spécifiques (médecine générale et physiothérapeute) et des ressources de vente au détail (supermarché) étaient plus fortement associées au temps consacré à l'AP chez les personnes âgées avec LLOA que chez celles sans LLOA. En particulier, les associations de lumière et de haute lumière PA avec les distances à ces ressources spécifiques étaient plus fortes chez les personnes âgées avec LLOA par rapport à leurs homologues sans LLOA.

Au fur et à mesure que la douleur et l'incapacité s'aggravent, la capacité d'adaptation à l'environnement peut diminuer et les défis environnementaux, tels que les distances perçues et objectivement plus grandes des services, peuvent devenir écrasants. Cela peut potentiellement conduire à éviter des situations difficiles et une PA restreinte [12, 13, 37, 38]. Nos résultats fournissent des preuves à l'appui de l'hypothèse de la docilité environnementale et confirment que moins un individu est compétent, plus l'impact des facteurs environnementaux sur cet individu est grand. Les associations entre certaines caractéristiques spécifiques de l'environnement bâti du quartier étaient plus fortes chez les personnes âgées avec LLOA que chez celles sans LLOA. Cependant, contrairement à nos attentes, les résultats ont montré que de plus grandes distances mesurées objectivement vers des ressources spécifiques étaient associées à plus de temps consacré à l'AP totale, à l'AP légère et à l'AP à haute lumière par les personnes âgées avec LLOA que par celles sans LLOA. Les personnes atteintes de LLOA peuvent utiliser davantage les services de santé que celles qui n'en sont pas atteintes et ces installations peuvent être plus importantes pour les personnes âgées atteintes de LLOA que pour leurs homologues sans LLOA [39]. En conséquence, les personnes âgées atteintes de LLOA peuvent être plus motivées à participer à l'AP par de plus grandes distances aux services de santé par rapport à celles sans LLOA. En outre, le médecin généraliste pourrait particulièrement encourager les personnes âgées atteintes d'un LLOA à être plus actives physiquement et, par conséquent, elles se contentent de marcher davantage vers les services de santé et les magasins de détail quotidiens, tels que les supermarchés. L'association entre le temps consacré à l'AP totale et les distances jusqu'à des services de santé spécifiques et des opportunités de vente au détail peut être plus forte chez les personnes âgées avec LLOA que chez celles sans LLOA, car il peut être plus difficile pour les personnes atteintes de LLOA de parcourir les distances jusqu'à ces ressources spécifiques et ils peuvent avoir besoin de plus de temps pour atteindre leur destination. Cependant, les résultats ne montrent pas de différences dans l'AP entre les deux groupes.

Cette étude a également montré qu'un taux plus élevé de rues interconnectées au sein d'un quartier était associé de manière marginale et significative à plus de temps consacré à l'AP à faible luminosité. Ce résultat est en accord avec les recherches antérieures [17]. Il a été suggéré qu'un taux plus élevé de connexions de rue dans un quartier offre plus d'options d'itinéraire de déplacement et facilite les déplacements directs, ce qui à son tour favorise l'activité physique [18]. Notre conclusion implique que l'AP des personnes âgées pourrait être facilitée en augmentant la densité des connexions de rue dans le quartier. En particulier, l'AP des personnes âgées pourrait être améliorée en augmentant le nombre d'infrastructures qui demandent littéralement de l'AP, comme les sentiers pédestres et les pistes cyclables. Il faut cependant être prudent dans l'interprétation de ce résultat. Les parcs ont une faible densité de routes, mais facilitent l'AP chez les personnes âgées [16]. Cependant, la présence de parcs n'a pas été prise en compte dans la présente étude.

À notre connaissance, il s'agit de la première étude basée sur la population qui s'est concentrée sur les associations entre l'AP mesurée objectivement et les caractéristiques de l'environnement bâti du quartier chez les personnes âgées avec et sans LLOA. Une force importante de cette étude est l'utilisation de l'accélérométrie pour évaluer objectivement le temps consacré à l'AP, au lieu des mesures autodéclarées de l'AP. Contrairement aux études précédentes qui se concentraient uniquement sur l'AP totale [6], des analyses détaillées ont été réalisées sur des catégories d'intensité d'AP spécifiques. Ainsi, il a été montré que des caractéristiques spécifiques de l'environnement bâti du quartier sont notamment associées au temps consacré à l'AP de lumière et de haute luminosité. Une autre force est que le temps consacré à l'AP a été collecté pendant sept jours ou plus pour la majorité des participants et, par conséquent, cette étude peut vraiment refléter le comportement habituel des personnes âgées. Des recherches antérieures sur la relation entre l'AP mesurée objectivement et les caractéristiques de l'environnement bâti ont été principalement menées aux États-Unis et en Australie [9, 10]. Cette étude peut contribuer à une meilleure compréhension des relations AP-environnement chez les personnes âgées de la population générale en Europe occidentale.

Certaines limites doivent également être reconnues. Dans cette étude, les seuils des catégories PA étaient basés sur Troiano et al. [23] et Matthews et al. [24]. Ces seuils ont été examinés chez les adultes. Bien que ces seuils soient largement utilisés et généralement acceptés, ils peuvent ne pas s'appliquer aux personnes âgées. Il existe des preuves que les seuils optimaux peuvent varier pour différents groupes d'âge, en raison de modèles d'activité différents, d'efficacité mécanique et de la nature contrastée des mouvements à différents stades de la vie [40]. Dans cette étude, l'emplacement géographique des participants pendant leurs activités physiques n'a pas été évalué, et donc les informations sur le contexte de l'AP manquaient. Les mesures d'AP dans cette étude incluent donc également l'AP qui a été effectuée à la maison ou à l'extérieur du quartier. Une autre limitation était que la distance routière moyenne en km de tous les résidents d'un quartier à une ressource spécifique était utilisée comme approximation de la distance entre le domicile des participants et cette ressource spécifique. En outre, le nombre de personnes atteintes de LLOA dans cette étude est faible et la variation de l'environnement bâti du quartier aux Pays-Bas est plutôt faible. Ces limites méthodologiques pourraient rendre plus difficile l'évaluation de la véritable taille des associations entre les caractéristiques de l'environnement bâti du quartier mesurées objectivement et l'AP. Enfin, cette étude n'a pas considéré l'autosélection résidentielle comme facteur de confusion dans la relation entre les caractéristiques de l'environnement bâti du quartier et l'AP. L'autosélection résidentielle est le phénomène selon lequel les gens choisissent leur lieu de résidence en fonction de leurs besoins et de leurs préférences [41]. Il se pourrait que les gens soient plus actifs physiquement parce que l'environnement bâti du quartier les y invite, mais il se pourrait aussi que les personnes qui aiment être physiquement actives aient tendance à choisir des quartiers résidentiels propices à l'exercice de cette préférence.

Dans les recherches futures, des seuils spécifiques concernant les catégories d'AP pour les personnes âgées doivent être développés afin de mesurer avec précision l'intensité de l'AP chez ces personnes. Les recherches futures ne devraient pas se concentrer uniquement sur les mesures d'AP basées sur le nombre de coups par minute sur l'axe y d'un accéléromètre, car des méthodes plus sophistiquées (par exemple, la reconnaissance de formes) pourraient devenir disponibles dans un proche avenir. Cela peut contribuer à une mesure plus détaillée de l'AP. De plus, les futures recherches sur les associations entre l'AP et les caractéristiques de l'environnement bâti du quartier pourraient utiliser les dispositifs du système de positionnement global (GPS) pour faire la distinction entre l'AP en dehors du quartier, l'AP dans le quartier et l'AP à la maison. L'utilisation de mesures GPS peut fournir plus d'informations sur la zone de mobilité de l'espace de vie des personnes âgées et aide à choisir des zones appropriées pour étudier les influences environnementales sur l'AP [42]. Cette étude s'est uniquement concentrée sur les associations d'AP avec la connectivité des rues et les distances à des ressources spécifiques mesurées objectivement. Des recherches futures sont nécessaires pour mieux comprendre les associations de l'AP avec d'autres aspects objectifs de l'environnement bâti du quartier, tels que la sécurité, la présence et l'état des sentiers et des pistes cyclables. De plus, les personnes ont des perceptions de l'environnement bâti du quartier qui peuvent ne pas correspondre aux mesures objectives [43]. Des recherches futures sont également nécessaires pour examiner comment les caractéristiques perçues de l'environnement bâti du quartier sont liées à des mesures objectives et comment ces aspects sont associés à l'AP. Pour obtenir plus d'informations sur la relation entre les caractéristiques de l'environnement bâti du quartier perçues et mesurées objectivement et l'AP chez les personnes âgées en bonne santé et fonctionnellement affaiblies, les recherches futures pourraient utiliser des entretiens « go-along » en plus des mesures objectives [44].


Installation de QGIS

QGIS sera l'outil GIS Desktop qui sera utilisé pendant le cours. C'est un logiciel libre et open source. C'est un projet très cool qui apporte toute la puissance de l'analyse SIG pour tout le monde. Nous discuterons de ses avantages et inconvénients par rapport aux autres outils GIS Desktop (par exemple, ArcGIS, GRASS, entre autres)

Ainsi, la première étape sera d'installer QGIS sur votre ordinateur portable. Ce logiciel est disponible pour Windows, Mac OS X, Linux et Android. Dans toutes les plateformes, l'environnement est assez similaire.

Notez que vous devez installer certains packages requis avant d'installer QGIS. Tout est très bien expliqué dans le fichier readme.

Pour les impatients


Linda Modrell

Position: Membre

Linda Modrell est titulaire d'un BS en commerce (comptabilité) et d'un MBA (mineure en santé communautaire) de l'Oregon State University. Elle a travaillé pendant plusieurs années dans le domaine de la politique de la santé avant de se présenter à un poste électif et a également été une employée de longue date de l'Oregon State University. Depuis 1999, date à laquelle Linda a été élue commissaire du comté de Benton, elle s'est principalement concentrée sur les questions de transport, de santé, d'eau, de politique fiscale et de gouvernance.


MATÉRIELS ET MÉTHODES

Description des données et de la zone d'étude.

Pour étudier la distribution spatiale de Listeria spp., nous avons utilisé des données recueillies dans le cadre d'une étude plus vaste, décrite par Sauders (38). En bref, sur une période de 2 ans (2001 et 2002), un total de 907 échantillons de sol, d'eau (y compris les étangs, les lacs, les flaques d'eau, les cours d'eau, les eaux de ruissellement et les marécages) et de végétation (y compris les algues des étangs, les bûches en décomposition , de l'herbe des champs, de l'herbe, des débris de feuilles et de la mousse) ont été collectés dans les quatre zones suivantes de l'État de New York (NYS), représentant l'environnement naturel : Finger Lakes National Forest (FLNF), Adirondack Park, Catskill Park et Connecticut Hill Zone de gestion de la faune (CHWMA). Plus précisément, en 2001, des échantillons ont été obtenus au cours de deux à trois visites par zone d'étude au printemps, en été et en automne, tandis qu'en 2002, chaque zone d'étude a été visitée une fois au printemps, en été et en automne. Les données de localisation géospatiale pour chaque échantillon ont été collectées avec un système de positionnement global (GPS) portable Garmin Emap. De plus, la date de prélèvement de l'échantillon a été enregistrée. Les échantillons ont été collectés dans des sacs Whirl-Pak stériles (Nasco, Fort Atkinson, WI) en utilisant des gants stériles et/ou des spatules ou des pelles en plastique jetables préstérilisées. Les échantillons ont été conservés sur de la glace humide jusqu'à 24 h avant d'être mis en culture. Tous les échantillons ont été cultivés pour la présence de Listeria avec enrichissement sélectif en Listeria bouillon d'enrichissement (Difco, Becton Dickinson, Sparks, MD). Isolé Listeria espèces étaient les suivantes : L. seeligeri (67%), L. welshimeri (24%), L. monocytogenes (6%), “L. marthii” sp. nov. (une nouvelle espèce 2%), et L. innocua (ρ%). Tous Listeria les isolats ont été caractérisés par amplification PCR et séquençage du cadre de lecture ouvert partiel du gène de réponse au stress sigB et, pour les isolats collectés en 2001, le gène de ménage écart. Cependant, les limites de la taille de l'échantillon ont empêché les analyses statistiques au niveau de l'espèce et du génotype. Il y avait 567 sites d'échantillonnage uniques dans l'étude Sauders (38). Des échantillons de sol, de végétation et d'eau ont été prélevés respectivement à 303, 302 et 294 de ces emplacements uniques. Comme tous les échantillons prélevés au même endroit partagent un ensemble d'observations identique, nous avons appliqué une règle simple pour caractériser la présence de Listeria dans une localité : un échantillon positif était suffisant pour considérer une localité comme positive. La même règle a été appliquée pour l'isolement des Listeria du sol, de la végétation et des couches d'eau d'un emplacement.

Modélisation des données spatiales.

Pour chaque emplacement échantillonné dans l'étude Sauders (38), nous avons obtenu des covariables spatialement référencées potentiellement pertinentes (détails et sources décrits ci-dessous) décrivant l'écologie locale à partir de modèles de données spatiales facilement disponibles. Tous les modèles de données spatiales et les données GPS pour les emplacements d'échantillonnage ont été importés dans ArcGIS 9 (ESRI, Redland, CA), reprojetés dans le système de coordonnées universel transversal de Mercator, North American Datum de 1983, découpés dans la zone d'étude et superposés avec des emplacements d'échantillonnage pour obtenir des informations sur les facteurs environnementaux associés à chaque emplacement d'échantillonnage. Au total, nous avons obtenu 77 variables (définies dans le tableau ​ Tableau1) 1 ) qui pourraient être regroupées sous les catégories suivantes : propriétés du sol, précipitations, température ambiante, alternance de températures de gel et de dégel (cycles gel-dégel), position géographique, et l'heure du calendrier. Les variables de propriété du sol (présentées dans le tableau ​ Tableau1) 1 ) ont été obtenues pour 13 comtés de NYS où l'échantillonnage a été effectué, à savoir Schuyler, Seneca, Hamilton, Tompkins, Greene, Delaware, Sullivan, Ulster, Essex, Fulton, Franklin, Herkimer , et Saint-Laurent, à partir des données tabulaires et spatiales compilées de la Soil Survey Geographic (SSURGO) (47). Les informations sur les précipitations avant le prélèvement des échantillons ont été obtenues auprès du U.S. Historical Climatology Network Daily Temperature, Precipitation, and Snow Data (54). Plus précisément, pour chaque site d'échantillonnage, la station météorologique la plus proche avec des informations disponibles sur les précipitations le jour et les jours avant la collecte des échantillons a été identifiée. On ne sait pas si les précipitations se produisant plus près ou plus loin avant le prélèvement de l'échantillon ont plus d'effet sur l'isolement des Listeria à partir d'un emplacement. Par conséquent, nous avons créé quatre variables décrivant la quantité de pluie le jour de la collecte de l'échantillon, ainsi que 1 jour, 2 jours et 3 jours avant (tableau ​ (tableau 1). 1 ). Comme l'effet des précipitations dure probablement plusieurs jours, la quantité moyenne de pluie sur une période donnée peut être un facteur plus important influençant l'isolement de Listeria spp. à partir d'un emplacement. Par conséquent, nous avons créé 10 variables de précipitations supplémentaires décrivant les précipitations moyennes au cours d'une fenêtre de temps sans cesse croissante avant la collecte de l'échantillon (tableau ​ (tableau 1). 1 ). Pour notre analyse, toutes les mesures de précipitations ont été converties de pouces en millimètres (1 in. = 25,4 mm). En plus des précipitations, des informations ont été obtenues sur la température ambiante le jour et les jours précédant le prélèvement des échantillons (54). Cependant, encore une fois, il n'est pas clair si la température quotidienne minimale, moyenne ou maximale influence le plus la récupération (isolement) de Listeria spp. à partir d'un emplacement. De plus, il n'est pas clair si la température les jours les plus proches de la collecte des échantillons ou les jours plus éloignés avant est plus influente. De plus, l'effet des températures ambiantes peut être cumulatif, et donc une moyenne des mesures sur plusieurs jours peut être un meilleur prédicteur de Listeria récupération. Par conséquent, en suivant la même approche que celle utilisée pour dériver et nommer les variables de précipitation, nous avons créé 14 variables pour chacune des températures ambiantes quotidiennes minimales, moyennes et maximales (tableau ​ (tableau1). 1 ). Pour notre analyse, toutes les mesures de température ont été converties de degrés Fahrenheit en degrés Celsius {ଌ = [(F − 32)/9] × 5}. Nous nous sommes également intéressés à l'effet des cycles de gel-dégel sur le statut d'isolement des Listeria spp. à partir d'un emplacement. L'occurrence des cycles de gel-dégel a été estimée à partir de Williams et al. (54) : si un jour quelconque au cours de la période de 10 jours précédant le prélèvement de l'échantillon ou deux jours consécutifs au cours de cette période, la température quotidienne minimale était inférieure à 0ଌ tandis que la température maximale était supérieure à 0ଌ, cela a été enregistré comme la apparition d'un cycle de gel-dégel. À partir de ces informations, nous avons créé six variables 𠇌ycle gel-dégel” (tableau ​ (tableau1). 1 ). Nous avons également cherché à savoir si la position géographique d'un emplacement d'échantillonnage par rapport aux directions cardinales, décrite par les coordonnées géographiques est et nord (exprimées en mètres), avait un effet sur l'isolement de Listeria spp. à partir d'un emplacement. L'abscisse fait référence à la distance mesurée vers l'est à partir de la « fausse abscisse », qui est définie de manière unique dans chaque zone de Mercator transversale universelle, tandis que l'ordonnée fait référence à la distance mesurée vers le nord à partir de l'équateur. Enfin, nous nous sommes intéressés à savoir si le calendrier de collecte des échantillons et la proximité des routes et des plans d'eau (lacs, rivières et ruisseaux) avaient un effet sur l'isolement des Listeria spp. à partir d'un emplacement (tableau ​ (tableau 1). 1 ). Pour déterminer la proximité d'un lieu d'échantillonnage par rapport à la route la plus proche, nous avons utilisé des données routières pour les comtés du NYS où les échantillons ont été collectés ainsi que pour deux comtés voisins, Oneida et Clinton (45). Des données spatiales sur l'hydrographie (31) ont été utilisées pour estimer la proximité du lieu d'échantillonnage par rapport au plan d'eau le plus proche. Bien que potentiellement pertinent, il n'y avait aucune information sur l'exposition de l'emplacement à la lumière du soleil, par exemple, versant nord par rapport au versant sud. Comme L. monocytogenes était le seul pathogène Listeria espèces représentées dans l'ensemble de données utilisé et comme il ne représentait que 6% de tous les Listeria spp., la proximité et la densité des populations de bétail et d'animaux sauvages dans la zone d'étude n'ont pas été prises en compte.

TABLEAU 1.

Noms, descriptions, attributs de définition et unités de mesure (le cas échéant) des variables considérées regroupées en propriétés du sol, précipitations, température ambiante, cycles de gel-dégel, position géographique et heure calendaire une

Catégorie et nom de variableLa descriptionDéfinir l'attributUnité de mesure
Propriétés du sol
    Loam.solObtenu en regroupant tous les types de sols dans la base de données SSURGO en tant que sol loam et non loamType de sol limoneux
    Pente.gradientDifférence d'altitude entre deux points, exprimée en pourcentage entre deux points et représentée comme le gradient de pente moyen pondéré de toutes les composantes dans l'unité de la carte SSURGO %
   �u.profondeurLa profondeur la plus faible d'une couche de sol humide (nappe phréatique) au cours de l'année, exprimée en cm à partir de la surface du sol pour les composants dont la composition dans l'unité cartographique SSURGO est égale ou supérieure à 15% cm
    Stockage.d'eau.25Le volume d'eau que le sol à la profondeur spécifiée peut stocker qui est disponible pour les plantes et exprimé en moyenne pondérée de tous les composants dans l'unité cartographique SSURGO25cmcm
    Stockage.d'eau.50Quant à Water.Storage.2550cmcm
    Stockage.d'eau.100Quant à Water.Storage.25100cmcm
    Stockage.d'eau.150Quant à Water.Storage.25150cmcm
   𠀽rainageLa condition de drainage naturel du sol (en référence à la fréquence et à la durée des périodes humides) de la classe de drainage dominante pour l'unité cartographique SSURGO b
Précipitation
    Précipitations.0Quantité de pluie le jour spécifiéJour t0mm
    Précipitations.1Quant aux précipitations.0Jour t1mm
    Précipitations.2Quant aux précipitations.0Jour t2mm
    Précipitations.3Quant aux précipitations.0Jour t3mm
    Précipitations.0_1Précipitations moyennes pour la période spécifiéePériode t0-t1mm
    Précipitations.0_2Quant aux précipitations.0_1Période t0-t2mm
    Précipitations.0_3Quant aux précipitations.0_1Période t0-t3mm
    Précipitations.0_4Quant aux précipitations.0_1Période t0-t4mm
    Précipitations.0_5Quant aux précipitations.0_1Période t0-t5mm
    Précipitations.0_6Quant aux précipitations.0_1Période t0-t6mm
    Précipitations.0_7Quant aux précipitations.0_1Période t0-t7mm
    Précipitations.0_8Quant aux précipitations.0_1Période t0-t8mm
    Précipitations.0_9Quant aux précipitations.0_1Période t0-t9mm
    Précipitations.0_10Quant aux précipitations.0_1Période t0-t10mm
Température ambiante
    Température.L.0Température minimale quotidienne le jour spécifiéJour t0
    Température.L.1Quant à la température.L.0Jour t1
    Température.L.2Quant à la température.L.0Jour t2
    Température.L.3Quant à la température.L.0Jour t3
    Température.L.0_1Moyenne de la température quotidienne minimale dans la période spécifiéePériode t0-t1
    Température.L.0_2Quant à la Température.L.0_1Période t0-t2
    Température.L.0_3Quant à la Température.L.0_1Période t0-t3
    Température.L.0_4Quant à la Température.L.0_1Période t0-t4
    Température.L.0_5Quant à la température.L.0_1Période t0-t5
    Température.L.0_6Quant à la température.L.0_1Période t0-t6
    Température.L.0_7Quant à la température.L.0_1Période t0-t7
    Température.L.0_8Quant à la température.L.0_1Période t0-t8
    Température.L.0_9Quant à la température.L.0_1Période t0-t9
    Température.L.0_10Quant à la Température.L.0_1Période t0-t10
    Température.a.0Température quotidienne moyenne le jour spécifiéJour t0
    Température.a.1Quant à la température.a.0Jour t1
    Température.a.2Quant à la température.a.0Jour t2
    Température.a.3Quant à la température.a.0Jour t3
    Température.a.0_1Moy de la température quotidienne moyenne dans la période spécifiéePériode t0-t1
    Température.a.0_2Quant à la température.a.0_1Période t0-t2
    Température.a.0_3Quant à la température.a.0_1Période t0-t3
    Température.a.0_4Quant à la température.a.0_1Période t0-t4
    Température.a.0_5Quant à la température.a.0_1Période t0-t5
    Température.a.0_6Quant à la température.a.0_1Période t0-t6
    Température.a.0_7Quant à la température.a.0_1Période t0-t7
    Température.a.0_8Quant à la température.a.0_1Période t0-t8
    Température.a.0_9Quant à la température.a.0_1Période t0-t9
    Température.a.0_10Quant à la température.a.0_1Période t0-t10
    Température.H.0Température quotidienne maximale le jour spécifiéJour t0
    Température.H.1Quant à la température.H.0Jour t1
    Température.H.2Quant à la température.H.0Jour t2
    Température.H.3Quant à la température.H.0Jour t3
    Température.H.0_1Moyenne de la température quotidienne maximale dans la période spécifiéePériode t0-t1
    Température.H.0_2Quant à la température.H.0_1Période t0-t2
    Température.H.0_3Quant à la température.H.0_1Période t0-t3
    Température.H.0_4Quant à la température.H.0_1Période t0-t4
    Température.H.0_5Quant à la température.H.0_1Période t0-t5
    Température.H.0_6Quant à la température.H.0_1Période t0-t6
    Température.H.0_7Quant à la température.H.0_1Période t0-t7
    Température.H.0_8Quant à la température.H.0_1Période t0-t8
    Température.H.0_9Quant à la température.H.0_1Période t0-t9
    Température.H.0_10Quant à la température.H.0_1Période t0-t10
Cycles de gel-dégel
    Geler.dégeler.0Cycle de gel-dégel se produisant le jour spécifiéJour t0N / A
    Geler.dégeler.1Quant à Freeze.thaw.0Jour t1N / A
   𠀿reeze.thaw.2Quant à Freeze.thaw.0Jour t2N / A
   𠀿reeze.thaw.3Quant à Freeze.thaw.0Jour t3N / A
   𠀿reeze.thaw.0_3Freeze-thaw cycle on any of the days in the specified periodPeriod t0-t3N / A
   𠀿reeze.thaw.s.0_10Total no. of freeze-thaw cycles during the specified periodPeriod t0-t10N / A
Geographic positions
    NorthingPosition with respect to the specified cardinal directionTo the Northm
   �stingPosition with respect to the specified cardinal directionTo the Eastm
   𠀽toroadProximity to the nearest road m
   𠀽towaterProximity to the nearest body of water m
    ParkNatural area where samples were collected N / A
Calendar time
    SeasonSeason when samples were collected N / A
    MonthMonth when samples were collected N / A

Statistical analysis.

All statistical analyses were performed by using R (34). Independent variables were first evaluated for unconditional associations with the dependent variable (i.e., the overall, as well as soil-, vegetation-, and water-specific occurrence of Listeria) using a chi-square test for categorical data and t test for continuous data. Fisher's exact test was used when one or more of the expected cell frequencies in two-by-two tables were less than 5 and when more than 20% of the expected cell frequencies were less than 5 in larger tables. To assess whether continuous variables satisfied the normality assumption, required for application of the t test, the D'Agostino-Pearson omnibus test was performed. If a continuous variable did not satisfy the normality assumption, the Wilcoxon rank-sum test was used. Continuous variables with considerable numbers of ties (e.g., related to a common weather station) were assessed by the exact Wilcoxon rank-sum test that computes exact conditional (on the data) P values and quantiles using the shift algorithm (43). Associations between independent categorical variables were tested by use of the chi-square test. Correlations between independent continuous variables were assessed based on Pearson's correlation coefficient for the normally distributed variables. Correlations between variables that did not satisfy the normality condition were assessed based on Spearman's rho coefficient. Associations between independent categorical and continuous variables were assessed by the t test, the Wilcoxon rank-sum test, or the exact Wilcoxon rank-sum test as appropriate. In the univariate analysis, P values of 𢙀.05 were considered statistically significant. Correction for multiple comparisons was not performed because of the exploratory character of the research to make sure that all important associations were identified. If more than one independent variable was associated with the dependent variable of interest at the 5% level, these variables were tested in a multivariable LR and CT. When two or more of the independent variables applicable for multivariable modeling were correlated, among the variables that had the most significant relationship with the dependent variable, the one that led to the greatest change in deviance in LR was retained in the LR and CT. Usually, this was the preferred discriminating factor in CT. Multivariable modeling was carried out on a subset of data, with complete observations on variables chosen to be included in the full LR model to assure a fair comparison between the LR and CT methods. The presence of spatial patterns in the Listeria spp. isolation data was analyzed by examination of the nearest-neighbor distance.

Correlation analysis indicated that weather variables, including 14 variables grouped under the rainfall set, 42 variables describing ambient temperatures (14 variables for each of the minimum, average, and maximum daily temperature measurements), and 6 variables describing freeze-thaw cycles, were highly correlated. Therefore, the 62 weather-related variables were subjected to a principal component analysis (PCA) to examine whether the three weather variables (precipitation, ambient temperatures, and freeze-thaw cycles) do in fact emerge. Because variables were measured in different units, prior to PCA, the data were standardized by subtracting the mean and dividing by the standard deviation, i.e., we performed an eigenanalysis of the correlation matrix. The number of meaningful components to retain was determined based on the proportion of variance accounted and the interpretability criteria (16). According to the proportion of variance accounted criterion, only components accounting for ϥ% of the total variance were retained. According to the interpretability criteria, (i) there had to be at least three variables with major loadings on each retained component (a general rule of thumb for a value of a loading that designates a useful signal is ଐ.2 to 0.35 [35]) and (ii) the rotated pattern had to demonstrate “simple structure.” Here, loading is a correlation coefficient between a variable and its principle component, while “simple structure” means that (a) most variables have relatively high factor loadings on only one component and near zero loadings on the other components and (b) most components have relatively high factor loadings for some variables and near zero loadings for the remaining variables.

The results of PCA were utilized in two scenarios. In the first scenario, weather variables loading on the same principal component were individually tested in univariate analysis and, among those statistically significantly associated with the dependent variable, one variable was chosen for the multivariable LR and CT modeling (as explained above). In the second scenario, weather variables in each retained principal component were substituted by a single continuous variable containing the predicted factor (component) scores. These variables were subject to univariate analysis and, where appropriate, used in the multivariable LR and CT modeling instead of all of the actual weather variables in the principal component.

The multivariable LR models were selected through an automatic stepwise regression (the “stepAIC” function in the MASS package) (49) based on the Akaike information criterion while obeying the principle of marginality. When applicable, the selected model was further simplified by extracting nonsignificant terms (P ≥ 0.05), starting with the most complex one. Each term deletion was followed by a likelihood ratio test. The assumption of a linear relationship between continuous explanatory variables and outcome was assessed by adding a quadratic term (the explanatory variable squared) to the model (9). When the quadratic term was found to be significant, the applicability of other polynomials was explored. An assessment of how the models fit the data was determined by using the Le Cessie-van Houwelingen-Copas-Hosmer test. Collinearity was investigated by calculating variance inflation factors (VIFs) for each of the explanatory variables in the multivariable model. To reduce high collinearity (VIF values of 㸐 and a mean of the VIFs considerably larger than 1) (4), one or more continuous variables in the model were centered (by subtracting the mean of the variable). Then the centered version of the variable was used in the model. An LR model can account for spatial autocorrelation in the data by inclusion of a spatial dependence variable and is then formally called an autologistic regression model (28). To assure a fair comparison with CT, which cannot directly consider spatial dependence in the data, we focused on analysis of the nonspatial LR models that did not consider spatial dependence. However, for the final nonspatial LR models that considered the actual weather variables (i.e., not the predicted component scores from PCA), variograms of the residuals were examined for evidence of spatial autocorrelation and the models were modified by inclusion of an autocovariate term. These autologistic regression models were analyzed to assess whether capturing spatial dependency in an LR model would change parameter estimates and their significance as well as the predictive performance of these models.

CT were built using the rpart package (44). The Gini index was used as a measure of node impurity. In pruning the tree to its optimal size, we used 10-fold cross-validation to choose the tree with the smallest misclassification error based on the 𠇁 − standard error” (1 − SE) rule. Microbial cultures used to detect a pathogen in an environmental sample usually have a very high specificity (meaning that there are very few if any false positive [FP] isolation results) and low sensitivity (meaning that many negatives are actually false negative [FN] results). Consequently, all the positives in the data set are most likely to be truly positive, while many negatives may in fact be FN. To account for that, FN were penalized more than FP costs of an FN and FP were set to 4 and 1, respectively. These costs produced trees with at least two nodes and were chosen through a trial-and-error method.

Testing the predictive performance of LR and CT.

To compare models produced by two different statistical methods, one would need a common criterion. This criterion must be unbiased and independent of the method used to develop a particular model (48). Comparing CT with LR is difficult because none of the error rates and goodness-of-fit statistics computed by the methods satisfy these requirements. The solution is to compare the models on the basis of their predictive accuracy, that is, the ability to correctly classify new cases in an independent test data set (48). However, we did not have the luxury of a large data set that could be divided into learning and independent test data sets. Therefore, predictive performance of the LR and CT was assessed on the same set of 10 subsamples of data through a 10-fold cross-validation and compared on two statistics, sensitivity and specificity. The outcome values predicted from a CT are dichotomous and could be easily summarized in a confusion matrix, from which sensitivity and specificity could be easily computed. However, the values predicted from an LR model vary continuously between 0 and 1. To dichotomize results of an LR model, a cutoff value is required. Choosing 0.5 as the cutoff is reasonable only if the prior probabilities of class 1 and class 0 are the same in the population of interest and if the costs of an FP and FN are the same (48). However, in our data sets, neither of the conditions was met. To account for the low sensitivity and high specificity of microbial cultures (and the corresponding high number of FN and low number of FP) and to assure comparability with the CT method, costs of an FN and FP were set to 4 and 1, respectively. Using these class-conditional misclassification costs, costs were estimated over the full range of possible cutoffs obtained from 10-fold cross-validation. The cutoff with the lowest associated misclassification cost was considered optimal and was used to dichotomize the LR output so that the confusion matrix could be constructed and sensitivity and specificity could be calculated. Because both LR and CT models were evaluated on the same data sets, Linnet and Brandt's test, an adaptation of McNemar's test for comparison of correlated proportions, was applied to test whether an observed difference in the test performances was statistically significant (25). Positive and negative isolates were divided into four groups according to the combined predictions of the two classifiers, LR and CT (Fig. ​ (Fig.1). 1 ). Then, the test statistic was

where . The null hypothesis of no difference between LR and CT was rejected if the absolute value of z exceeded 1.96 (two-sided test 2α = 0.05). If the Linnet and Brandt's test showed a statistically significant difference between LR and CT, two separate McNemar's tests were conducted to test the null hypotheses of equal sensitivities (from the “Listeria present” cross-tabulation in Fig. ​ Fig.1) 1 ) and specificities (from the “Listeria absent” cross-tabulation in Fig. ​ Fig.1) 1 ) obtained for the two classifiers (LR and CT).

Cross-tabulations of isolation results (Listeria absent and Listeria present) for Linnet and Brandt's test to compare the predictive performance of any two classifiers A and B (e.g., LR and CT models). 𠇀” indicates a negative isolation result, and 𠇁” indicates a positive one. b′ is the number of negative samples classified correctly by classifier B and classified falsely by classifier A and conversely for c′ samples. Analogous reasoning applies to the positive samples.


Running Grass7 in conda environment? - Systèmes d'information géographique

Within today s high-powered computer environment, geographic information systems (GIS) argue for the digital map to be a basic descriptive tool of all demographers. Digital maps enable spatial relationship portrayals with great ease, and help uncover clues from geographic map patterns that remain hidden when geographic data are presented solely in tabular forms. Spatial analysis, with special reference to spatial statistics, is the companion of these maps. But presently demography lacks theories depicting why geography matters for demographic outcomes, for the most part having only rather simple interregional accounting types of models. A first step in such theory formulation involves going from population maps as a descriptive tool for demographers to employing geographic variation and local contexts as explanatory variables for demographic outcomes. Demographers have devoted considerable effort to conceptualizing time s contribution to such outcomes, in terms of, for example, age, period, cohort individual, family, and historical time. But no real analogy exists in demographic thinking for the role of geographic space, beyond impacts of migration. Accounting for geographic space effects at least should reflect the collective influence of individuals living in geographic units, and the configuration of these units, on individual demographic outcomes (i.e., neighborhood effects). After all, geographic location is not randomly assigned or selected, but rather is a matter of individual constrained choice.

The goal of this course is to further promote the growing popularity of GIS and spatial analysis in demography by treating spatial analytical approaches involving demographic data that are geographically referenced. Relevant issues to be addressed include: the role of geographic scale, spatial heterogeneity, spatial autocorrelation/dependency, and the specification and estimation of spatial models. Software to be used includes: MINITAB, R, GeoBUGS, and GRASS.

This five-day course will begin on Monday, November 28, and will end on Friday, December 2. On each day there will be a lecture from 9 a.m. to 12 noon, and a lab session from 2 to 5 p.m.

Day 1:
- review of multivariate statistics for georeferenced data
- review of materials in Sweeney s CSISS introductory course

Day 2:
- spatial and space-time autocorrelation
- selected implementation demonstrations in MINITAB, R

Day 3:
- auto-models
- geostatistical models

Day 4:
- spatial autocorrelation in generalized linear models (emphasis on Poisson, logistic, binomial models)
- applications to China census data

Day 5:
- Bayesian modeling with GeoBUGS
- identifying hot spots in the geographic distribution of old age

The course is explicitly aimed at the needs of non-statisticians and non-mathematicians. Nevertheless some willingness and interest in dealing with formulas, data and computers is necessary. Basic applied univariate and multivariate statistical knowledge is required. Familiarity with GIS is preferable, although basic GIS functionality will be reviewed during the labs.

Each student is to have a georeferenced demographic dataset in which s/he is interested, and with which s/he will perform spatial analyses throughout the duration of the course. A short report (i.e., 10-15 pages, including graphics) will be required, by the end of the course, in which concepts presented in the lectures must be utilized, and spatial analysis tools developed during the labs must be employed.

Reading material will be made available during the course.

Bivand, R. 2002. Spatial econometrics functions in R: Classes and methods, J. of Geographical Systems. 4: 405-421.

Bivand, R., and A. Gebhardt. 2000. Implementing functions for spatial statistical analysis using the R language, J. of Geographical Systems. 2: 307-317.

Goodchild, M. and D. Janelle (eds.). 2003. Spatially Integrated Social Science: Examples in Best Practice. NY: Oxford University Press.

GRASS GIS: http://grass.itc.it/grass60/

Matthews, S. 2003. GIS and spatial demography, GIS Resource Document 03-63 (GIS-RD-03-63). L'Université d'État de Pennsylvanie.

Population Research and Policy Review: forthcoming special issue on "spatial demography"

Population, Space and Place: 1995 to present.

Rogers, A. 1971. Matrix Models in Urban and Regional Analysis. San Francisco, CA: Holden-Day.

Woods, R., and P. Rees (eds.). 1986. Population Structures and Models: Developments in Spatial Demography. London: Allen and Unwin.


Voir la vidéo: Watershed Analysis in GRASS GIS