Que pouvez-vous faire ou ne pas faire avec les données de Telraam ?

Data • Rédigé par Kris Vanherle sur 10 May 2023

L'interprétation des données est importante, et c'est pourquoi nous pensons qu'une approche scientifique citoyenne de la collecte de données sur le trafic présente un grand potentiel. Non seulement les citoyens sont motivés pour collecter et examiner les données, mais ils peuvent également apporter leurs connaissances et leur expérience locales afin d'ajouter le contexte si important. J'espère que ce billet vous aidera à comprendre ce que vous pouvez faire pour commencer à utiliser vos données Telraam.

Si vous êtes l'heureux propriétaire d'un appareil Telraam, qu'il s'agisse de notre capteur original "V1" basé sur Raspberry Pi ou de notre tout nouveau capteur S2, vous vous êtes probablement demandé : "OK, j'ai des mois et des mois de données Telraam pour ma rue, et maintenant?"

Risques et avantages

Dans ce billet, je vais essayer de vous donner un aperçu des analyses raisonnables que vous pouvez faire avec les données de comptage de trafic, en particulier avec le type de données que votre capteur Telraam produit. Telraam étant " né " à Transport & Mobility Leuven, un groupe d'ingénieurs spécialisés dans l'analyse des données de trafic, nous connaissons la valeur que les données Telraam peuvent apporter, mais aussi les risques encourus si vous " sur interprétez " ou ignorez les limites des données brutes de comptage de trafic.

Comme toute technologie, Telraam n'est pas "parfait", les données Telraam ne le sont pas non plus. Nous estimons actuellement que la précision des comptages de trafic motorisé est de 90-95% (pour S2) ou de 85-90% (pour V1). Pour les vélos/piétons, la précision est plus faible - même sur des sites appropriés -, tandis que le capteur V1 est plus sujet à des erreurs de classification. Le nouveau capteur S2 est plus précis pour les vélos/piétons (+/- 80-85%) avec un risque beaucoup plus faible d'erreur de classification (par exemple, un groupe de vélos est compté comme une voiture).

La particularité des données Telraam est qu'elles sont générées sur une longue période. Les données de comptage du trafic sont généralement limitées dans le temps, par exemple en utilisant des tubes pneumatiques ou des systèmes de caméras temporaires (LIDAR, ANPR) sur une période de quelques semaines seulement, ou plus limité encore, en effectuant un comptage manuel pendant quelques heures seulement. Le volume de données que vous collectez avec un capteur Telraam est un atout en soi. Vous devez tirer le meilleur parti de cet atout lorsque vous examinez vos données. Je vous montrerai ci-dessous comment, avec 3 exemples de ce que vous pouvez faire avec vos données Telraam.

Exemple 1 : Séries chronologiques

Dans une analyse de séries chronologiques, vous représentez le volume de voitures/vélo/piétons (axe Y) en fonction du temps (axe X). Il s'agit d'un graphique facile à générer et à comprendre. Cependant, il est important de garder quelques points à l'esprit.

Tout d'abord, NE PAS tracer ce graphique pour les totaux journaliers avec les données Telraam. Prenez le temps de réfléchir à la raison de ce choix...

...

Indice : Telraam (actuellement et historiquement) ne génère des données que lorsqu'il fait jour.

Ici, en Belgique, il y a environ 6 heures de différence entre l'hiver et l'été, donc si vous tracez des totaux journaliers, vous verrez de grandes différences saisonnières, ce qui n'est pas utile, ou pire, pourrait donner des informations trompeuses sur les tendances du trafic. Alors, qu'est-ce qui est mieux ? Vous pouvez tracer des totaux horaires, en contournant le fait qu'il y a moins d'heures avec des données en hiver qu'en été, c'est facile ! Il faut toutefois être prudent, car en hiver (profond), il se peut que vous manquiez des données sur les heures de pointe les plus chargées. L'approche la plus sûre consiste à ne sélectionner que les heures pour lesquelles il existe des données toute l'année.

Que peut-on apprendre d'un tel graphique ? L'exemple ci-dessus, qui est en fait le dispositif Telraam actif dans les bureaux du Premier ministre belge (je ne plaisante pas) dans la Wetstraat, permet de tirer quelques enseignements "en un coup d'œil". Le trafic automobile est resté plus ou moins stable, avec des volumes réduits pendant les vacances de Noël. En revanche, le trafic des deux-roues a augmenté au mois d'août et plus tard. Il y a également un pic intéressant fin août/début septembre.

Ce type de graphique est utile pour

Voir quelles sont les périodes qu'il est intéressant d'explorer plus en profondeur.
Avoir un aperçu rapide des "événements" dans les données : des périodes courtes ou longues de volumes de trafic atypiques élevés/faibles.
Identifier les intervalles de temps spécifiques sur lesquels vous souhaitez concentrer votre analyse. Il est préférable d'ignorer les périodes pour lesquelles les données sont manquantes (par exemple, le capteur était temporairement hors ligne) ou les périodes dont vous savez qu'elles ne sont pas représentatives pour une raison ou une autre.

Exemple 2 : Volumes typiques

C'est le type d'analyse où les données Telraam sont les plus performantes. Sélectionnez un intervalle (long) et déterminez le modèle de trafic "typique" pour cette période. Voici deux exemples d'une journée (de travail) type à gauche et d'une semaine type à droite. Pour le profil journalier type, prenez la valeur médiane (et non la moyenne, je vous expliquerai pourquoi plus tard) pour chaque heure d'une journée de travail, pour une période de 2 mois. Il y a environ 40 jours hors week-end en 2 mois, vous avez donc 40 points de données pour chaque heure de la journée. Le trafic fluctue quelque peu, mais avec 40 points de données, vous disposez de suffisamment de données pour déterminer ce qui est typique pour chaque heure.

La valeur médiane est la valeur moyenne si vous classez les données de la plus petite à la plus grande, ce qui vous permet d'écarter automatiquement les valeurs aberrantes et les volumes de trafic atypiques au cours de cette période. La médiane est préférable à la moyenne, car cette dernière peut fausser la valeur typique vers le haut (ou vers le bas) si vous avez une ou plusieurs heures de volumes de trafic follement élevés (ou bas).

Le principe est le suivant : plus il y a de données, mieux c'est. Plus l'intervalle de temps choisi pour déterminer vos volumes typiques est long, plus il est stable et représentatif de votre rue. Cependant, il n'existe pas de "norme d'or" en la matière et vous devez comprendre que vous cachez toute fluctuation des schémas de trafic au cours de la période choisie. Par exemple, si vous choisissez une période allant du 1er mai au 1er août pour obtenir un schéma typique, vous travaillez avec 3 mois de données (ce qui est bien), mais vous mélangez également un mois de vacances scolaires (juillet) avec 2 mois "normaux" (mai et juin). Le schéma de circulation qui en résulte serait-il vraiment "typique" ?...

En ingénierie de la circulation, les mois les plus "normaux" pour déterminer le trafic typique sont généralement mars/avril/mai/juin et septembre/octobre/novembre. Les mois de décembre/janvier/juillet/août ne sont pas typiques en raison des vacances. La détermination de la période représentative dépend fortement du contexte. Par exemple, les travaux de construction peuvent influencer considérablement le trafic et vous ne voulez pas sélectionner une période où il s'est passé quelque chose qui influence les schémas de trafic typiques...

... ou peut-être est-ce exactement ce que vous voulez faire ? Dans certains cas, en effet, c'est exactement ce que vous voulez faire, alors allons-y !

Exemple 3 : Comparaison de périodes

En partant de profils types - soit une journée type (avec le volume de trafic par heure), soit une semaine type (avec le volume de trafic par jour), vous pouvez également comparer le trafic type pour différentes périodes. Ce type d'analyse est extrêmement utile si vous souhaitez comprendre si une intervention ou un événement - planifié ou non - entraîne une modification systématique du volume de trafic.

Une action ciblée, telle que l'introduction d'une nouvelle piste cyclable ou d'une restriction d'accès, vise spécifiquement à obtenir un changement systématique des schémas de circulation. Si vous voulez savoir si cette intervention est efficace, systématiquement, vous devez mesurer pendant une longue période pour voir si les schémas de circulation typiques sont (systématiquement) différents dans la période précédant l'intervention par rapport à la période suivant l'intervention.

Les mêmes "règles" s'appliquent ici que dans l'exemple précédent. Vous devez disposer d'une période représentative. Notez que vous n'avez pas nécessairement besoin d'une période exactement identique pour la comparaison ; vous pouvez prendre 3 mois de données pour déterminer votre schéma de circulation typique "de base" et le comparer à 1 mois de données pour déterminer le schéma de circulation typique après l'intervention. Cette dernière est juste un peu plus incertaine pour être effectivement qualifiée de "typique". De plus, dans certains cas, il faut du temps pour que les schémas de circulation s'adaptent à une nouvelle situation. Il faut donc prévoir une période suffisamment longue après l'intervention pour pouvoir affirmer qu'il existe un nouveau schéma de circulation type. Le choix des bons intervalles de temps n'est pas une science exacte...

Une fois que vous avez obtenu deux périodes avec un trafic typique, la question est de savoir comment reconnaître un changement significatif dans le schéma de trafic.

Dans l'introduction, nous avons noté que la précision de Telraam n'est pas de 100%. Vous vous demandez peut-être si vous pouvez faire des déclarations si les volumes de trafic typiques diffèrent, disons de 10 %, avant/après une intervention, pour un dispositif dont la précision est de 85 à 90 %. Le volume de données de Telraam est le principal atout de ce dispositif. Tout d'abord, toute erreur de comptage accidentelle, quelle qu'en soit la raison, n'est pas un problème lorsque l'on travaille avec des modèles de trafic typiques. Le trafic typique est stable, n'est pas affecté par des erreurs fortuites, mais peut être sujet à des erreurs systématiques. Toutefois, comme l'erreur systématique est la même avant et après l'intervention, les deux schémas typiques sont tout à fait comparables !

Cela dit, il y aura toujours une certaine variation dans les volumes de trafic, de sorte qu'il est encore difficile d'affirmer que les schémas de trafic ont changé de manière systématique. Quelle est l'ampleur de la variation qui indiquerait un changement significatif et systématique ?

Dans l'exemple ci-dessus, nous représentons le trafic automobile typique (figure de gauche) et le trafic des deux-roues (figure de droite) pour deux périodes, pour un lundi typique (ligne pleine) et un samedi typique (ligne pointillée). Il est évident que les schémas ne sont pas _exactement_ les mêmes, mais ils le sont plus ou moins. Les indications d'une différence statistiquement significative entre les deux périodes seraient vraies si la forme du schéma était la même pour les deux périodes, alors que les volumes pour chaque heure sont plus élevés/plus bas dans une période par rapport à l'autre. Dans cet exemple, on ne voit pas vraiment de différence entre les deux périodes, SAUF pour le trafic des deux-roues dans l'après-midi. Il y a un net décalage d'environ 100/h entre 15h00 et 18h00. Une autre indication est que cette observation est valable aussi bien pour les lundis (ligne pleine) que pour les samedis (ligne en pointillés), ce qui donne un autre indice qu'il se passe quelque chose. Cette comparaison permet d'affirmer que le trafic des deux-roues a augmenté systématiquement à partir (dans ce cas) du 27 septembre.

CONCLUSION

Le message de cet article de blog est de vous encourager à aller de l'avant et à laisser vos données raconter une histoire, mais de maintenir un bon niveau de prudence lors de l'interprétation de ces données.

Vous devrez être attentif au contexte qui sous-tend les phénomènes que vous observez dans les données. Ce contexte est important. Ce que vous pensez voir existe-t-il vraiment ? Par exemple, l'augmentation de la circulation des vélos peut-elle être due à l'aménagement d'une nouvelle piste cyclable ? ou au fait que le temps a été beaucoup plus clément ces derniers temps ?

Les données ont leurs limites, c'est pourquoi je préfère le terme "éclairé par les données" à celui, plus courant, de "guidé par les données". Ne laissez pas les données vous égarer !

Il y aura des erreurs. Il ne sert à rien de prétendre qu'il n'y en a pas. Chez Telraam, nous avons choisi de ne pas cacher ou masquer les erreurs des capteurs et de vous présenter les données brutes. Nous rendons également les données "ouvertes" afin que chacun puisse y ajouter sa propre interprétation.

L'interprétation des données est importante, et c'est pourquoi nous pensons qu'une approche scientifique citoyenne de la collecte de données sur le trafic présente un grand potentiel. Non seulement les citoyens sont motivés pour collecter et examiner les données, mais ils peuvent également apporter leurs connaissances et leur expérience locales afin d'ajouter le contexte si important.

J'espère que ce billet vous aidera à comprendre ce que vous pouvez faire pour commencer à utiliser vos données Telraam.

Vous pouvez toujours faire plus, alors n'hésitez pas à partager vos histoires, vos expériences et vos questions avec la communauté Telraam afin que nous puissions construire ensemble une image plus équitable et mieux informée, avec des données.

(Ces chiffres ont été créés à l'aide de la "feuille de rue" de Telraam. Cette fonctionnalité est une analyse automatisée disponible pour les appareils Telraam qui font partie d'un projet, dans un réseau professionnel. Nous prévoyons de débloquer ces fonctionnalités dans un avenir proche pour les utilisateurs individuels également. Vous pouvez générer tous ces graphiques à partir de la page de détail par segment, ou télécharger et traiter vos données dans Excel.)