Résumé de la thèse :
Ces dernières années, les cyberattaques sont devenues de plus en plus fréquentes et sophistiquées, faisant de la cybersécurité dans le secteur des soins de santé une préoccupation mondiale urgente. Parmi les facteurs responsables de cette fragilité, on peut citer la dépendance excessive des établissements de santé à l'égard des infrastructures numériques reliées, les informations sensibles sur les patients et l'utilisation de systèmes de sécurité obsolètes. Cette thèse explore une approche multicouche de la cybersécurité dans les soins de santé en utilisant la technologie des bases de données, l'intelligence artificielle (IA), l'apprentissage machine (ML) et les méthodologies d'évaluation des risques. Nous commençons par évaluer le paysage actuel des menaces au moyen d'une application web qui exploite les enregistrements de cyberincidents accessibles au public, principalement du Center for International and Security Studies Maryland (CISSM), qui contient plus de 1 500 cas liés aux soins de santé, et de l'Office for Civil Rights (OCR), qui a documenté plus de 800 incidents ayant fait l'objet d'une enquête. La plateforme développée permet aux utilisateurs d'ajouter, de supprimer, de rechercher, de visualiser et de télécharger des incidents cybernétiques.
Pour traiter les vulnérabilités en matière de cybersécurité, nous présentons le cadre d'évaluation des risques cybernétiques de l'hôpital universitaire de Baze (BUHCRAF), appliqué à l'hôpital universitaire de Baze en tant qu'étude de cas. Ce cadre identifie plus de 50 risques de sécurité, dont certains sont liés à des menaces connues documentées dans la base de données Common Vulnerabilities and Exposures (CVE). Les principaux risques comprennent les logiciels non corrigés, les dispositifs médicaux IoT non sécurisés et les contrôles d'accès faibles. Sur la base de ces connaissances, des solutions de cybersécurité pilotées par l'IA/ML sont proposées. L'étude comprend plusieurs études de cas démontrant les applications de l'IA/ML dans la cybersécurité. Le premier cas porte sur la détection d'anomalies dans l'Internet de la santé des objets (IoHT), en utilisant l'ensemble de données ECU-IoHT contenant 111 000 enregistrements et cinq classes d'attaques (Normal, Nmap, DoS, ARP, Smurf). Nous comparons quatre modèles ML - Forêt aléatoire (RF), Gradient Boosting (GB), Arbres de décision (DT) et Perceptron multicouche (MLP) - où GB atteint la plus grande précision de 99,53%. La deuxième étude de cas applique l'IA/ML à la détection du phishing, en analysant des caractéristiques telles que l'URL de la requête, l'âge du domaine, le statut HTTPS/SSL, le trafic du site web et les pop-ups. Des machines à vecteurs de support (SVM) ont été utilisées avec deux fonctions de noyau : la fonction de base radiale (RBF) et la fonction polynomiale. Le noyau polynomial est plus performant que le noyau RBF, avec une précision de 84,5 % contre 82,6 %. La troisième étude de cas explore l'IA/ML dans la détection des intrusions en proposant un cadre Cross-ML utilisant trois ensembles de données publiques : UNSW-NB15, X-IIoTID et ToN-IoT. Les modèles individuels impliquent des modèles formés sur leurs ensembles de données respectifs qui ont obtenu des scores F1 allant de 92,0 % à 98,1 %, tandis que l'approche combinée des ensembles de données a enregistré une précision de 90,9 %, un rappel de 84,0 % et un score F1 de 84,9 %. Les évaluations transversales ont montré que le modèle X-IIoTID testé sur ToN-IoT a obtenu les meilleures performances, avec une précision de 75 % et un score F1 de 74 %. Cette recherche souligne l'importance d'une approche de cybersécurité multicouche qui intègre une approche axée sur les bases de données, des applications de sécurité améliorées par l'IA/ML et des cadres d'évaluation des risques structurés pour renforcer la résilience de la cybersécurité dans les organismes de soins de santé.
Abstract :
In recent years, there has been a growing frequency and sophistication in cyberattacks, which have made cybersecurity in the healthcare sector a pressing global concern. Some of the factors responsible for this fragility include overdependence of healthcare facilities on linked digital infrastructures, sensitive patient information, and the use of antiquated security systems. This thesis explores a multilayered cybersecurity approach in healthcare using database technology, artificial intelligence (AI), machine learning (ML), and risk assessment methodologies. We begin by assessing the current threat landscape through a web application that leverages publicly available cyber incident records mainly from the Center for International and Security Studies Maryland (CISSM), which contains over 1,500 healthcare-related cases, and the Office for Civil Rights (OCR), which has documented over 800 investigated incidents. The developed platform enables users to add, delete, search, view, and download cyber-related incidents. . To address cybersecurity vulnerabilities, we introduce the Baze University Hospital Cyber Risk Assessment Framework (BUHCRAF), applied at Baze University Hospital as a case study. This framework identifies over 50 security risks, with some linked to known threats documented in the Common Vulnerabilities and Exposures (CVE) database. Key risks include unpatched software, unsecured medical IoT devices, and weak access controls. Based on these insights, AI/ML-driven cybersecurity solutions are proposed. The study includes several case studies demonstrating AI/ML applications in cybersecurity. The first case focuses on anomaly detection in the Internet of Health Things (IoHT), using the ECU-IoHT dataset containing 111,000 records and five attack classes (Normal, Nmap, DoS, ARP, Smurf). We compare four ML models—Random Forest (RF), Gradient Boosting (GB), Decision Trees (DT), and Multilayer Perceptron (MLP)—where GB achieves the highest accuracy of 99.53%. The second case study applies AI/ML to phishing detection, analyzing features such as request URL, domain age, HTTPS/SSL status, website traffic, and pop-ups. Support Vector Machines (SVM) were used with two kernel functions—Radial Basis Function (RBF) and Polynomial. The Polynomial kernel outperformed RBF, achieving 84.5% accuracy compared to 82.6%. The third case study explores AI/ML in intrusion detection by proposing a Cross-ML framework using three public datasets: UNSW-NB15, X-IIoTID, and ToN-IoT. Individual models implies models trained on their respective datasets achieved F1-scores ranging from 92.0% to 98.1%, while the combined dataset approach recorded an accuracy of 90.9%, recall of 84.0%, and an F1-score of 84.9%. Cross-dataset evaluations showed that the X-IIoTID model tested on ToN-IoT achieved the best performance, reaching 75% accuracy and a 74% F1-score. This research highlights the importance of a multilayered cybersecurity approach that integrates database-driven approach, AI/ML-enhanced security applications, and structured risk assessment frameworks to strengthen cybersecurity resilience in healthcare organizations.