Anomaly Detection and Degradation Indicator through Machine Learning:Random Matrix approach

Updated: 26 days ago
Location: Troyes, CHAMPAGNE ARDENNE
Job Type: FullTime
Deadline: 30 May 2024

3 Apr 2024
Job Information
Organisation/Company

Université de Technologie de Troyes
Research Field

Computer science » Database management
Engineering
Researcher Profile

Recognised Researcher (R2)
Leading Researcher (R4)
First Stage Researcher (R1)
Established Researcher (R3)
Country

France
Application Deadline

30 May 2024 - 22:00 (UTC)
Type of Contract

Temporary
Job Status

Full-time
Offer Starting Date

1 Oct 2024
Is the job funded through the EU Research Framework Programme?

Not funded by an EU programme
Is the Job related to staff position within a Research Infrastructure?

No

Offer Description

Optimizing maintenance for industrial production systems is a major concern for maintenance managers who aim to implement the most relevant policies from both technical and economic perspectives. Existing age-based preventive maintenance policies on the market are starting to fall short of meeting the personalized and eco-responsible needs by efficiently utilizing resources. In this context, the transition from conventional maintenance to 'smart' maintenance has become an important topic. Predictive maintenance emerges as an effective solution because it not only anticipates failures in advance through system monitoring and health state prediction but also optimizes human and material resources to reduce maintenance costs and the severity of consequences resulting from a breakdown.

With the widespread adoption of digital technologies such as connected objects, the Internet of Things (IoT), big data, artificial intelligence, and data science, predictive maintenance is increasingly being embraced and adapted, becoming a major strategic focus within companies. For example, Air France - KLM utilized flight histories of A-380s and landings in Paris to establish a Big Data program capable of detecting a potential failure in less than an hour and diagnosing it within five minutes. A Big Data project by SNCF Transiliens aims to automate fault diagnosis using real-time data from connected trains, providing a more precise and comprehensive view of equipment status.

Despite its promising expectations, implementing predictive maintenance remains a significant challenge due to the lack of real-time knowledge about the system's health status. Developing online degradation indicators for a system based on monitoring data is therefore a central issue in predictive maintenance. This involves considering increasingly abundant and diverse data (Big Data) from sensor networks in indicator construction. The indicator should be simple yet dimensionally reduced, aiming to estimate the remaining system lifespan. This approach often requires a large number of sensors, which can be costly. Thus, developing a degradation indicator that balances quality and economy is a major challenge.

From a scientific perspective, this challenge involves three main issues:
1. Developing a data dimension reduction method suitable for both supervised and unsupervised contexts.
2. Specifying the placement of sensors among those planned to provide significant data for degradation indicator construction.
3. Developing degradation indicators from selected data and validating them.

The objective of this thesis is to develop a new tool to address the above three issues.

Funding category: Contrat doctoral
UTT salary
PHD title: Doctorat en Sciences pour l'Ingénieur, spécialité Optimisation et Sûreté des Systèmes
PHD Country: France


Requirements
Specific Requirements

La réalisation de ce projet de thèse nécessite d’avoir des connaissances à l’interface des domaines des probabilités/statistiques, de l'intelligence artificielle, de la maintenance prédictive. Plus précisément, le projet peut se déployer selon les deux axes suivants.

1. Détection d’anomalies et sélection de variables : La détection d’anomalies est un enjeu majeur dans l’industrie actuelle, et l’afflux de données issues d’une multitude d’objets connectés impose la recherche de méthodes multidimensionnelles, intelligentes et adaptées à la complexité des données récoltées. Nous proposons d’explorer et compléter la théorie des matrices aléatoires combinée aux méthodes du deep learning afin de proposer de nouvelles méthodes de détection d’anomalies bien adaptées au contexte industriel complexe. Après récolte et nettoyage des données, nous les stockerons dans une matrice, qui sera de grande dimension, et nous traduisons la complexité de la donnée par un facteur aléatoire. Nous nous proposons donc de traiter cette grande matrice aléatoire de données à l’aide de réseaux de neurones de types auto-encodeurs convolutifs (AEC) afin de détecter d’éventuelles anomalies.

Dans un premier temps, nous mobilisons les connaissances en matrices aléatoires afin de définir une stratégie AEC adaptée de détection. Nous proposons de définir un modèle à variances isolées adapté, qui modélise bien les données contenant des outliers ou des informations rares ou soudaines. Par le biais d’une étude spectrale, les évènements rares peuvent être mis en évidence en étudiant le comportement global des valeurs et vecteurs propres dans un premier temps et ensuite l’étude des valeurs propres extrêmes via un AEC ainsi que les vecteurs propres associés. Cette étude se fera dans un contexte asymptotique, cas où les dimensions de la matrice des données sont très grandes, mais aussi dans un cadre fini, dans le cas où les données significatives récoltées sont de petites tailles. Dans un second temps, nous nous intéresserons à la sélection des capteurs les plus pertinents. Nous pensons traduire la matrice de données en terme de matrice d’adjacence d’un certain graphe aléatoire et développer des méthodes exploitant les connaissances en graphes aléatoires afin de trancher quant au choix des features.

2. Définition d’un indicateur de dégradation : Une maintenance prévisionnelle nécessite aussi bien l’évaluation de l’état de dégradation du système que le pronostic sur l’apparition de futures panne. Un indicateur de dégradation permet de se rendre compte de l’état de dégradation du système. Une définition efficace de cet indicateur est donc indispensable. Nous partons d’une définition d’un indicateur de dégradation en terme de métrique entre l’instant de défaillance et tous les autres instants. Nous nous intéresserons aux méthodes à noyaux appliquées dans un cadre aléatoire afin de définir/tester plusieurs types de métriques (distance euclidienne, distance exponentielle, etc.) et d’en choisir les plus prometteuses.

D’un point de vue pratique, les méthodes développées peuvent être testées et validées sur plusieurs jeux de données mis à disposition par la communauté PHM. Nous citons à titre d’exemple le jeu de données construit par un centre de recherche de la NASA à partir des simulations des turboréacteurs d’avion avec le Modèle C-MAPSS.

Nous sommes à la recherche un(e) candidat(e) qui possède une ou plusieurs compétences suivantes:
1. Probabilité et statistiques
2. Intelligence artificielle, machine learning.
3. Un bon niveau en programmation (Matlab, Python ou Julialang) et une première expérience en recherche sont appréciés.


Additional Information
Work Location(s)
Number of offers available
1
Company/Institute
Université de Technologie de Troyes
Country
France
City
Troyes
Geofield


Where to apply
Website

https://www.abg.asso.fr/fr/candidatOffres/show/id_offre/122107

Contact
Website

http://www.utt.fr

STATUS: EXPIRED