Panorama des techniques de datamining - Quelles techniques pour la détection du signal faible dans un contexte dintelligence économique?
Date de publication :
22/10/2007
Langue :
Français
Format :
Nombre de pages :
17 pages
Sommaire :
Sommaire
- Les méthodes statistiques ou probabilistes
- L'approche des mots associés
- Méthodes d'analyse factorielle
- Méthodes de classifications
- Les méthodes issues de l'Intelligence Artificielle
- Les méthodes symboliques
- Les règles d'associations
- Les arbres de décision
- Les méthodes numériques ou adaptatives
- Les réseaux de neurones
- Perceptron multicouche
- Modèle de Hopfield
- Le modèle de Kohonen
- Le modèle topographique auto-adaptatif
- Le modèle de détecteur de nouveauté
- Les algorithmes génétiques (parfois appelés algorithmes évolutionnaires)
Résumé :
Dans un cadre d'intelligence économique, il est nécessaire de pouvoir prendre des décisions à temps afin d'être à même de réagir face à un environnement. Le recueil de données (bibliographiques, numériques, formelles ou informelles) ne suffit pas pour la prise de décision de la part d'un décideur. L'étape d'exploitation et d'analyse des données est cruciale, et ces dernières années ont vu l'émergence d'outils et méthodes permettant une analyse plus fine des données.
C'est ce qu'on appelle le datamining (DM) qui consiste à explorer et analyser des données volumineuses afin d'en extraire de la connaissance cachée pour prédire et agir. Ainsi, la motivation principale de cette démarche est la valorisation d'une grande base ou entrepôt de données (data warehouse) par la recherche d'informations pertinentes pour le décideur afin de l'aider dans sa décision finale.
Schématiquement, quatre objectifs non exclusifs sont la cible d'une telle prospection :
- exploration pour une première approche des données, leur vérification par la recherche d'incohérences, de données atypiques, manquantes ou erronées, leur transformation préalable à d'autres traitements;
- Classification (clustering) pour exhiber une typologie ou une segmentation des observations;
- Modélisation par un ensemble de variables explicatives d'une variable cible quantitative ou qualitative. Il s'agit alors d'une régression ou d'une discrimination (ou classement);
- Recherche de forme sans apprentissage. Il s'agit de déceler une configuration originale se démarquant des données.
Les technologies du datamining s'appliquent à de nombreux domaines :
- La grande distribution avec analyse des comportements des consommateurs, recherche de similarités des consommateurs en fonction des critères géographiques, et prédiction des taux de réponse en marketing direct ;
- Les laboratoires pharmaceutiques avec identification des meilleures thérapies pour différentes maladies, optimisation des plans d'action des visiteurs médicaux pour le lancement de nouveaux produits ;
- Les banques avec recherche de forme d'utilisation de cartes caractéristiques d'une fraude et modélisations prédictives des clients partants ;
- Les assurances avec analyse des sinistres et recherche des critères explicatifs du risque ou de fraude ;
- L'aéronautique, l'automobile avec prévision des ventes et dépouillements d'enquête de satisfaction ;
- Les télécommunications, eau et énergie avec détection des formes de consommation frauduleuses, classification des clients selon la forme d'utilisation des services et prévision du départ des clients.
Ces applications sont loin d'être exhaustives puisque le datamining s'illustre dans les disciplines scientifiques confrontées à la détection de motifs ou formes (patterns) dans des volumes de données considérables : génomique, astrophysique.
La plupart des outils de datamining ont pour objectif premier de déterminer les relations qui existent entre variables. Ils s'apparentent à la statistique (inférence statistique) ou à l'intelligence artificielle (déduction de règles) et propose à l'utilisateur des hypothèses d'explication des données en faisant apparaître des corrélations cachées jusqu'alors.
Beaucoup de logiciels sont consacrés à la fouille de données, une bonne soixantaine sont répertoriés dans les sites consacrés au sujet et comparés. La plupart mettent en avant des interfaces graphiques sophistiquées, un accès intégré aux bases de données et insistent sur une automatisation poussée des traitements. Certains sont axés sur des familles de techniques (par exemple les réseaux neuronaux), d'autres sont plutôt généralistes en offrant un large choix de techniques, ou encore certains se spécialisent sur un domaine particulier comme l'analyse de texte appliquée à la veille technologique (ceux-ci sont des logiciels de text mining).
Toutes les approches de datamining ne sont pas développées dans la suite de cet état de l'art. En effet, mon objectif est d'identifier celles qui pourront être susceptibles de détecter des signaux faibles dans le cadre d'un besoin décisionnel.
Dernières nouveautés dans la catégorie : Management organisation
2
Management et gestion d'une équipe : coaching et démarches psychosociologiques de l'individu
Exposé | 13/11/2009 | fr | .doc | 4 pages
4
La mise en place du système de management de la qualité au sein de l'entreprise selon le référentiel ISO 9001/2000 : l'exemple de Pharmal, filiale du Groupe Saidal
Mémoire | 12/11/2009 | fr | .doc | 112 pages
5
Annie Bartoli, "Le management dans les organisations publiques", 2005
Fiche de lecture | 12/11/2009 | fr | .doc | 53 pages
Les plus consultés sur 30 jours en : Management organisation
1
La méthode Hay: une méthode de classification analytique
Exposé | 27/11/2007 | fr | .doc | 26 pages
2
Les salons de massage : étude de marché et stratégie d'implantation.
Étude de marché | 29/02/2008 | fr | .doc | 22 pages
3
Business-plan : 'La Baguett'in', projet de création d'une boulangerie-drive
Étude de cas | 08/06/2009 | fr | .doc | 30 pages
5
La culture d'entreprise et le management interculturel
Mémoire | 15/06/2006 | fr | .doc | 46 pages
