Documentation

Comment fonctionne atp2osm et comment contribuer.

Qu'est-ce qu'une « marque » ?

La notion de marque vient directement d'All The Places (ATP). ATP est une base de données collaborative structurée autour des enseignes nationales et internationales : chaînes de magasins, réseaux de restauration, banques, chaînes de pharmacies… Chaque enseigne y est identifiée par un code Wikidata unique — par exemple Q37158 pour Zara. Les commerces indépendants (boulangerie de quartier, restaurant local…) n'en font pas partie.

Quelques termes clés

spider
Programme dédié à une seule enseigne, qui collecte automatiquement ses données depuis son site officiel (horaires d'ouverture, téléphone, adresse…).
scraping
Technique d'extraction automatique d'informations depuis des pages web. C'est ce que fait chaque spider ATP pour récupérer les données d'une enseigne.

atp2osm reprend cette structure et importe les données enseigne par enseigne, en suivant fidèlement les spiders ATP. Cela garantit que toutes les données d'une même enseigne proviennent d'une source unique et homogène — ce qui permet de valider la qualité d'un spider en contrôlant un échantillon aléatoire de 1 % des correspondances, et d'étendre cette confiance à l'ensemble de l'importation.

Résumé

Ce qui est fait

  • Ajout des tags opening_hours, phone, website, email manquants
  • Correspondance sur nœuds, ways et relations
  • Regroupement des imports par département
  • Traçabilité complète dans l'historique

Ce qui n'est pas fait

  • Création de nouveaux nœuds OSM
  • Modification ou suppression de tags existants
  • Modification de la géométrie
  • Import sans validation humaine

Principe général

atp2osm est un outil d'enrichissement d'OpenStreetMap à partir des données All The Places (ATP). ATP collecte automatiquement les informations des points d'intérêt (horaires, téléphone, site web, email) directement depuis les sites officiels des enseignes.

L'outil compare ces données avec les nœuds OSM existants, identifie les tags manquants, et vous permet de valider puis d'importer ces enrichissements directement dans OSM via votre compte. Aucun nœud n'est créé ou supprimé — seuls des tags manquants sont ajoutés.

Le processus en détail

  • Collecte des données ATP

    Chaque semaine, les dernières données ATP sont téléchargées depuis alltheplaces.xyz. Elles contiennent les POIs français avec leurs attributs extraits des sites officiels des enseignes.

  • Mise à jour des données OSM

    En parallèle, les données OSM de France métropolitaine sont importées dans la base locale via osm2pgsql.

  • Correspondance spatiale et attributaire

    Chaque POI ATP est mis en correspondance avec les nœuds OSM dans un rayon de 500 m, en vérifiant au moins un attribut commun parmi : brand:wikidata, brand, name, phone, website, email. Les correspondances ambiguës (plusieurs nœuds OSM pour un même POI ATP) sont écartées.

  • Calcul des tags manquants

    Pour chaque correspondance retenue, l'outil calcule quels tags sont présents dans ATP mais absents dans OSM. Seuls les tags manquants sont proposés — les tags existants ne sont jamais modifiés.

  • Validation et import

    Vous vérifiez les changements proposés pour une marque, puis vous déclenchez l'import. Les modifications sont envoyées à l'API OSM via votre compte, groupées par département.

Comment contribuer

  1. 1

    Connectez-vous avec votre compte OSM

    Utilisez le bouton de connexion en bas du menu. Vos imports seront enregistrés sous votre nom dans l'historique OSM des changesets.

  2. 2

    Choisissez une marque

    La page Marques à importer liste toutes les enseignes pour lesquelles des enrichissements sont disponibles, avec le nombre de nœuds concernés.

  3. 3

    Vérifiez les correspondances

    Pour chaque nœud, vérifiez que la correspondance ATP ↔ OSM est correcte : position géographique, nom de l'établissement, tags proposés. En cas de doute, consultez la source ATP ou la fiche OSM avant de valider.

  4. 4

    Importez

    Si les données vous semblent correctes, lancez l'import. Les changesets sont créés automatiquement sur OSM, un par département. L'opération est irréversible — assurez-vous d'avoir vérifié les données.

Validation des marques

La validation se fait marque par marque : avant d'importer une enseigne, vous contrôlez un échantillon aléatoire de 1 % de ses établissements. Si les données de cet échantillon sont correctes, la fiabilité est considérée comme acquise pour l'ensemble des établissements de cette enseigne — c'est la cohérence du spider (source unique) qui le permet.

Avant de valider, assurez-vous que les éléments vérifiés sont représentatifs : testez plusieurs établissements dans des régions différentes, vérifiez les cas limites (horaires spéciaux, numéros de téléphone mal formatés, URLs redirigées…). Si le moindre doute persiste sur la qualité du spider, signalez une erreur plutôt que de valider.

Statuts des imports

Chaque import enregistré dans l'historique se voit attribuer un statut reflétant son résultat.

Succès

Import réussi

Tous les changements ont été envoyés à OpenStreetMap et sont désormais visibles publiquement.

Partiel

Import partiellement réussi

Certains départements n'ont pas pu être importés suite à une erreur de l'API OpenStreetMap. Les changements envoyés sont néanmoins visibles sur OSM. Les données non importées resteront disponibles pour un prochain import.

Annulé

Import annulé — données signalées

L'import a été interrompu suite à la détection d'erreurs par un contributeur dans les données ATP. Aucune modification n'a été envoyée à OpenStreetMap.

Erreur

Erreur technique

Une erreur indépendante de votre action a empêché l'import de se terminer. Aucune modification n'a été envoyée à OpenStreetMap. Vous pouvez relancer l'import depuis la page de la marque concernée après 4 semaines. Ce délai permet de laisser le temps de corriger les éventuels erreurs dans les jeux de données.

Licences

OpenStreetMap

Les données OSM sont publiées sous licence ODbL 1.0 (Open Database License). Toute contribution via cet outil est soumise aux Contributor Terms d'OpenStreetMap.

All The Places

Les données ATP sont publiées sous licence CC0 1.0 (domaine public). Leur utilisation est libre sans restriction.

atp2osm

Le code source de cet outil est publié sous licence GPL-3.0. Les contributions sont les bienvenues sur GitHub.

Ressources