Time Series Analysis, l’analyse des séries temporelles

Pour les passionné.e.s de mathématiques, une série temporelle, ou Time Serie en anglais, est une suite de données listées ou représentées graphiquement par ordre chronologique. C’est une série de données indexée par le temps. Elle est constituée d’observations enregistrées à intervalles réguliers, le plus souvent, et constitue donc une forme de données discrètes, c’est à dire discontinues. La période de collecte de mesure peut aller de quelques secondes, voir millisecondes à plusieurs siècles, tout dépend des phénomènes étudiés.

Les séries temporelles se retrouvent dans de nombreux pans de la vie réelle et dans de nombreux domaines. Parmi les exemples courants, on peut citer la hauteur des marées océaniques, le nombre de taches solaires, les relevés de température quotidiens. Une série temporelle, cela peut être aussi bien l’évolution de la population ou du PIB d’un pays, qu’un électrocardiogramme ou l’évolution des vues d’une vidéo. On en retrouve beaucoup en milieu industriel, avec le suivi de processus de production et le relevé des macros associées (températures, pression, couplage…)

L’analyse et la prédiction des séries temporelles sont donc d’un intérêt primordial pour beaucoup d’industries et secteurs d’activités. Maintenance prédictive, prédiction d’anomalies ou analyse des phénomènes climatiques, analyser et prédire une série temporelle c’est prédire le futur (comme souvent en science des données).

Analysons ensemble le pourquoi du comment.

Comment se compose une série temporelle ?

(Attention, on va faire un peu de maths. Tout va bien)

Traditionnellement, une série temporelle est faite de trois éléments :

  • Une tendance, nommée Tt
  • Une saisonnalité, nommée St
  • Un résidu ou erreur, nommé εt

Mathématiquement, on peut donc traduire une série temporelle par Xt = Tt  + St + εt

Avec T la tendance, S la saisonnalité,  ε le résidu et t l’indexation temporelle.

La tendance

La tendance correspond à un comportement croissant ou décroissant d’une série au cours du temps.  Elle reflète souvent un phénomène de croissance ou décroissance sur le long terme. La tendance d’une série temporelle peut prendre différentes formes : linéaire, quadratique ou exponentielle.

La saisonnalité

La saisonnalité reflète la présence d’un phénomène périodique qui se répète tout au long de la série temporelle. De nombreuse données présentent des saisonnalités, en particulier les données météorologiques (évolution de la température au cours du temps), et certaines séries temporelles présentent à la fois une tendance et une saisonnalité, comme c’est le cas pour le trafic aérien mondial. Il est possible d’observer à la fois une croissance du trafic aérien tout en remarquant une différence forte entre le trafic hivernal et estival.

Le résidu

Le résidu du modèle correspond à la partie de la série temporelle que la décomposition ne permet pas d’expliquer. En effet, on ne peut pas décomposer intégralement une série temporelle uniquement selon une tendance et une saisonnalité. Idéalement le résidu du modèle est stationnaire, c’est-à-dire que le processus restant n’évolue pas avec le temps. Si le résidu de notre série temporelle n’est pas stationnaire, cela signifie que certaines composantes temporelles ne sont pas expliquées dans le modèle. Le Graal de la modélisation des séries temporelles est d’obtenir un résidu de type bruit blanc, c’est-à-dire un résidu qui ne contient plus aucune information temporelle, un signal stationnaire aléatoire et décorrélé.

L’analyse de séries temporelles

L’analyse des séries temporelles désigne un ensemble de méthodes et techniques statistiques permettant d’extraire des informations pertinentes et d’identifier des schémas sous-jacents à partir des données brutes. Elle consiste à identifier les tendances, la saisonnalité et les irrégularités dans les données observées sur différentes périodes, utiles pour comprendre la structure et les structures sous-jacents des données. Bien que l’analyse de régression puisse être utilisée pour examiner les relations entre plusieurs séries temporelles, le terme « analyse des séries temporelles » désigne généralement l’étude de la structure interne et de la dépendance temporelle au sein d’une même série.

L’analyse des séries temporelles ne vise pas à prédire l’avenir, mais à comprendre le passé. Elle permet aux développeurs de décomposer les données en leurs composantes (tendance, saisonnalité et résidus) afin d’identifier les anomalies ou les changements de tendance au fil du temps. Elle repose essentiellement sur l’identification des orientations sur une période donnée, généralement grâce à des agrégats glissants qui lissent les fluctuations à court terme pour révéler une tendance à long terme, ainsi que sur celle de la saisonnalité, pour mettre en évidence les schémas répétitifs et cycliques présents dans les données

L’analyse des séries temporelles diffère de la modélisation de ces dernières. Ce sont deux outils puissants, aux objectifs différents. Comme nous l’avons dit, l’analyse propose une vision de ce qui a été, tandis que la prévision par modélisation donne une idée de ce qui pourrait être.


Une fois l’analyse des séries temporelles effectuée, il est possible de construire un modèle, afin d’étendre notre compréhension des données et tenter de prédire des comportements futurs. La modélisation de séries temporelles, plus communément appelée Time Series Forecasting, est un domaine entier d’apprentissage machine, et mérite un article à lui seul (bientôt sur Data 101 !). Notons cependant qu’il existe plusieurs algorithmes, certains sont plus appropriés que d’autres, dépendant de la nature du jeu de données, et du résultat souhaité.

Applications IRL

Dans de nombreux secteurs, il est essentiel de comprendre les forces et la structure sous-jacentes qui ont produit les tendances observées dans les données. Les situations complexes du monde réel suivent rarement des schémas prédéfinis, et l’analyse des séries temporelles permet de les étudier, ainsi que toutes leurs variables observées au fil du temps. Cette application vise généralement à comprendre les processus qui se déroulent progressivement et sur une période donnée.

L’avènement de l’Industrie 4.0 et de l’IOT (Internet of Things, ou internet des objets) a entraîné une augmentation de la quantité de données annotées temporellement grâce à des capteurs moins chers, une connectivité accrue et une prise de conscience croissante du potentiel des données. L’importance de l’analyse des séries temporelles s’est accrue, notamment dans les milieux industriels. La maintenance prédictive, technique visant à déterminer et à prédire l’état des équipements en fonction de facteurs influents tels que les niveaux de stress ou les modèles d’utilisation et qui mérite également un article (soon), est rendue possible par modélisation des séries temporelles issues des mesures en continues des équipements. La prédiction de qualité des pièces lors des processus de fabrication discrets et continus permet, elle, l’optimisation de chaîne de production, afin de réduire les coûts et matériaux gâchés.

Mais l’industrie n’est pas le seul secteur d’activité où l’analyse de séries temporelles peut apporter beaucoup. Elle peut par exemple permettre aux entreprises et commerces de comprendre le comportement passé, présent et futur de leurs clients, produits, marchés ou concurrents. Elle peut révéler des variations saisonnières, des fluctuations cycliques ou des tendances à long terme des ventes ou de la demande, et aider à optimiser les opérations, stratégies et ressources. Dans le domaine scientifique, elle peut aider les chercheurs/chercheuses et les ingénieur.e.s à étudier la dynamique et l’évolution des systèmes naturels ou artificiels, aider les météorologues à prévoir le temps, les sismologues à détecter les tremblements de terre, les biologistes à analyser l’expression des gènes ou les ingénieurs à surveiller et contrôler les processus industriels. Enfin, l’analyse des séries chronologiquespeut aider les épidémiologistes à suivre et à prévoir la propagation des maladies, les psychologues à mesurer et à améliorer la santé mentale, ou les sociologues à suivre et mieux comprendre les tendances sociales.

Sources

  • Time Series Analysis and Its Applications, 4rth Edition (2016), Shumway & Stoffer
  • Time Series Analysis in Industrial Applications, Chris et al. (2016)
  • Forecasting: Principles and Practice (3rd ed), Rob J Hyndman and George Athanasopoulos

Un projet en tête ?

Discutons !

Commentaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *