Please use this identifier to cite or link to this item:
http://localhost:8080/xmlui/handle/123456789/6184| Title: | Application de l'intelligence artificielle à la prédiction des bandes d'éxposition professionnelle (OEB) dans l'Industrie pharmaceutique |
| Authors: | Chergui, Achraf Amir Nasri, Hani Abderrahman Encadré par :Pr. Lalaouna, Abd El Djalil |
| Keywords: | Réseaux de Neurones Artificiels, Occupational Exposure Banding (OEB) Sécurité pharmaceutique Modélisation prédictive Descripteurs moléculaires Algorithme génétique |
| Issue Date: | 2025 |
| Publisher: | Université Constantine 3 Salah Boubnider,Faculté de Médecine |
| Abstract: | RÉSUMÉ Introduction : Le développement rapide des Ingrédients Pharmaceutiques Actifs Hautement Puissants (HPAPIs) dans l’industrie pharmaceutique présente des risques importants en matière de sécurité au travail. Une évaluation des dangers rapide et précise est essentielle, mais les méthodes traditionnelles sont souvent limitées par l’absence de données toxicologiques pour les nouveaux composés. La pratique actuelle du Occupational Exposure Banding (OEB) constitue un outil essentiel de catégorisation des risques, mais elle peut s’avérer lente et consommatrice de ressources, créant ainsi un goulot d’étranglement difficile à adapter au rythme de la découverte de médicaments. Il existe donc un besoin urgent d’approches plus rapides, fondées sur les données, pour faciliter et accélérer l’attribution des classes OEB. Méthode : Cette étude propose et valide une approche innovante utilisant les Réseaux de Neurones Artificiels (RNA) pour prédire la classe OEB de composés pharmaceutiques à partir de leur structure moléculaire. Un jeu de données de 314 composés avec des classifications OEB validées a été compilé à partir de Fiches de Données de Sécurité. Plus de 2 000 descripteurs moléculaires ont été calculés, puis optimisés en un sous-ensemble de 334 grâce à un Algorithme Génétique afin de maximiser la puissance prédictive. Des modèles de Perceptron Multicouche (MLP) ont ensuite été entraînés et validés pour chacune des cinq classes OEB, considérées comme des tâches distinctes de classification binaire. Résultats : Les modèles prédictifs ont démontré une grande précision et une robustesse élevée. Sur les ensembles de validation indépendants, les modèles ensemblistes ont atteint des scores F1 de 83,33 % pour OEB1, 85,71 % pour OEB2, 85,71 % pour OEB3 et 88,89 % pour OEB4. Le modèle relatif à OEB5, représentant le niveau de danger le plus élevé, a obtenu un score F1 parfait de 100 %, indiquant une identification sans faille des composés à haut risque. Les valeurs de la courbe ROC-AUC étaient systématiquement élevées, atteignant notamment 0,90 pour OEB1 et 1,00 pour OEB5, confirmant un excellent pouvoir discriminant. Conclusion : Cette recherche confirme la faisabilité de l’utilisation des RNA comme outil rapide et fiable pour la prédiction des classes OEB. Le modèle proposé constitue une méthode objective et fondée sur les données, capable de soutenir et d’accélérer l’évaluation des risques professionnels, tout en permettant une mise en œuvre plus efficace des mesures de sécurité dans l’industrie pharmaceutique. Mots-clés : Réseaux de Neurones Artificiels, Occupational Exposure Banding (OEB), Sécurité pharmaceutique, Modélisation prédictive, Descripteurs moléculaires, Algorithme génétique الملخّص المقدمة: يشكّل التطور السريع في إنتاج المكوّنات الدوائية النّشطة ذات الفعالية العالية في قطاع الصناعات الدوائية مخاطر مهنية ملحوظة تتطلب إجراء تقييمات سريعة ودقيقة للمخاطر، غير أنّ الطرق التقليدية لتقييم المخاطر غالباً ما تواجه قيوداً عملية نتيجة افتقارها إلى بيانات سُمّية كافية عن المركبات الجديدة، ومن ثمّ تظلّ عملية تصنيف مستوى التعرض المهني عملية أساسية لكنها بطبيعتها قد تستهلك وقتاً وجهداً كبيرين وتُشكّل عنق زجاجة أمام وتيرة اكتشاف وتطوير اﻷدوية؛ لذلك فإنّ الحاجة ملحّة لتبني أساليب أسرع ومبنية على البيانات لدعم وتيسير عملية إسناد فئات التصنيف. المنهجية: تقترح هذه الدراسة وتتحقق من فعالية نهج مبتكر قائم على الشبكات العصبية اﻻصطناعية للتنبؤ بفئة التعرض المهني للمركبات الصيدﻻنية انطﻼقاً من خصائصها البنيوية والجزيئية، حيث جُمعت قاعدة بيانات تضمّ 314 مركباً مصنّفاً حسب فئات التعرض استناداً إلى نشرات بيانات السﻼمة، وحُسب أكثر من 2000 واصف جزيئي ثم خُفض هذا العدد إلى 334 واصفاً مُختاراً عبر خوارزمية وراثية بهدف تعظيم القدرة التنبؤية، بعد ذلك طُوّرت نماذج اﻹدراك متعدد الطبقات وتمّ تدريب كل نموذج وتهييئته كمسألة تصنيف ثنائي مستقلة لكلّ واحدة من الفئات الخمس للتعرض. النتائج: أظهرت النماذج التنبؤية دقةً وموثوقية عالية عند تقييمها على مجموعات تحقق مستقلة؛ فقد حقّقت النماذج المجمّعة معدﻻت F1 بمقدار 83.33٪ لفئة 1، و85.71٪ لكلّ من الفئة 2 والفئة 3، و88.89٪ للفئة 4، بينما سجّل نموذج الفئة 5 — المُمثّل ﻷعلى مستوى من الخطر — درجة F1 كاملة بلﻐت 100٪، ما يدلّ على تحديدٍ دقيقٍ وخالٍ من الخطأ للمركبات عالية المخاطر في العيّنة المختبرة؛ كما كانت قيم المساحة تحت منحنى ROC مرتفعة باستمرار وبلﻐت على سبيل المثال 0.90 للفئة 1 و1.00 للفئة 5، ممّا يعكس قدرة تمييز ممتازة للنماذج. الخاتمة: تبرهن هذه الدراسة على أ ﱠن الشبكات العصبية اﻻصطناعية تشكّل أداة سريعة وموثوقة للتنبؤ بفئات التعرض، وتقدّم طريقة موضوعية قائمة على البيانات يمكن أن تسرّع وتدعم عمليّة تقييم المخاطر المهنية، وبالتالي تُسهِم في تنفيذ تدابير السﻼمة بشكل أكثر كفاءة داخل صناعة اﻷدوية. الكلمات المفتاحية: الشبكات العصبية اﻻصطناعية، تصنيف التعرض المهني، السﻼمة الصيدﻻنية، النمذجة التنبؤية، الواصفات الجزيئية، الخوارزمية الوراثية. ABSTRACT Introduction: The pharmaceutical industry's rapid development of Highly Potent Active Pharmaceutical Ingredients (HPAPIs) presents significant occupational safety risks. Timely and accurate hazard assessment is crucial, but traditional methods are often hampered by a lack of toxicological data for novel compounds. The current practice of Occupational Exposure Banding (OEB) is a vital risk categorization tool but can be slow and resource- intensive, creating a bottleneck that struggles to keep pace with drug discovery. There is a need for faster, data-driven approaches to support and streamline OEB assignment. Method: This study proposes and validates a novel approach using Artificial Neural Networks (ANNs) to predict the OEB class of pharmaceutical compounds from their molecular structure. A dataset of 314 compounds with validated OEB classifications was compiled from Safety Data Sheets. Over 2,000 molecular descriptors were calculated and subsequently optimized to a subset of 334 using a Genetic Algorithm to maximize predictive power. Multilayer Perceptron (MLP) models were then trained and validated for each of the five OEB classes as separate binary classification tasks. Results: The predictive models demonstrated high accuracy and robustness. On the independent validation sets, the ensemble models achieved F1-scores of 83.33% for OEB1, 85.71% for OEB2, 85.71% for OEB3, and 88.89% for OEB4. The model for OEB5, representing the highest hazard level, achieved a perfect F1-score of 100%, indicating flawless identification of high-risk compounds. The Receiver Operating Characteristic-Area Under the Curve (ROC-AUC) values were consistently high, notably reaching 0.90 for OEB1 and 1.00 for OEB5, confirming excellent discriminatory power. Conclusion: This research confirms the viability of using ANNs as a rapid and reliable tool for OEB prediction. The proposed model provides an objective, data-driven method that can effectively support and accelerate occupational hazard assessment, enabling more efficient implementation of safety measures in the pharmaceutical industry. Keywords: Artificial Neural Networks, Occupational Exposure Banding (OEB), Pharmaceutical Safety, Predictive Modeling, Molecular Descriptors, Genetic Algorithm |
| Description: | MPH25/18 |
| URI: | http://localhost:8080/xmlui/handle/123456789/6184 |
| Appears in Collections: | Mémoires en Pharmacie / مذكرات في الصيدلة |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.