CONFÉRENCE
Extraction automatique du contenu des forums clandestins criminels.
Le haut-parleur
Olivier Michaud
Expert IA @Flare Systems
Olivier est actuellement étudiant à la maîtrise en génie logiciel avec concentration en intelligence artificielle à l'École de technologie supérieure (ETS). Ses acquis lui ont permis d'entamer cette maîtrise lors de sa dernière année de baccalauréat en génie logiciel à la même école. Fier représentant du Québec à la Compétition canadienne de génie en 2020, Olivier s'est démarqué en remportant la bourse d'excellence de l'École de technologie supérieure afin de poursuivre ses études aux cycles supérieurs. Son intérêt pour l'intelligence artificielle l'a amené à travailler avec Flare Systems, désormais partenaire de ses recherches. Au cours de ses études de premier cycle, Olivier s'est particulièrement impliqué au sein du Lan ETS Club en plus d'être chargé d'animer des cours de laboratoire.
Résumé de la conférence
Extraction automatique du contenu des forums clandestins criminels.
25 septembre 2021 à 10 h 45 HNE
Avec l'avènement de nouveaux canaux de communication qui tirent parti des technologies d'anonymat et des crypto-monnaies, l'underground criminel s'est considérablement développé au cours des 10 à 20 dernières années. Les acteurs malveillants au sein de cet clandestin utilisent des marchés et des forums de discussion illicites pour communiquer et négocier des techniques et des outils de plus en plus avancés pour extorquer, voler des identités et des données. De nombreuses plateformes de facilitation sont hébergées sur le réseau Tor, un canal de communication qui fait partie du dark web. L'anonymat fourni par le réseau Tor a rendu de plus en plus difficile pour les forces de l'ordre et les institutions touchées par ces attaques de se protéger. Selon une enquête réalisée par le groupe CyberEdge, 86 % des entreprises de plus de 500 employés ont été victimes d'une cyberattaque réussie en 2020. De plus, 60 % des publicités non liées à la drogue pour des biens et services illicites publiées sur le dark web ont été jugés susceptibles d'avoir un impact sur une entreprise (Guccione, 2021). La surveillance de la criminalité clandestine aide les victimes potentielles à détecter les attaques passées et futures et à y répondre plus efficacement. En d'autres termes, il aide les victimes à développer une stratégie proactive pour mieux faire face aux menaces d'aujourd'hui. Afin d'automatiser le processus de surveillance de la clandestinité criminelle, des technologies du domaine du Web Crawling et du Web Scraping ont été proposées. L'exploration Web fait référence au processus de navigation automatique sur le Web à l'aide d'un robot pour indexer son contenu. Le web scraping, quant à lui, est l'ensemble des techniques utilisées pour extraire le contenu d'une page HTML. Ces technologies reposent généralement sur des configurations manuelles, ce qui augmente encore les coûts d'exploitation. Dans cette conférence, nous proposons une méthode pour automatiser la collecte de données des forums dans la clandestinité criminelle. Plus précisément, l'accent de cette présentation est mis sur les pages contenant des sujets de forum, à partir desquels le titre, l'auteur et la date de publication de chaque entrée seront extraits. Le procédé proposé permet de transformer une page HTML afin de réaliser un « étiquetage de séquences », une technique dans le domaine du traitement du langage naturel. Cela fonctionne non seulement sur les forums utilisés pendant la formation, mais peut également être généralisé à d'autres forums inconnus.
Télécharger le programme complet
Rencontrez Flare là-bas!
Notre équipe sera à Bsides toute la journée du 25 septembre 2021.