Analytics & Data IntelligenceDatamining & Business Analytics

Coheris Analytics Spad
Arbre de décision & Algorithmes de Data Mining

Algorithmes de Data Mining (arbre de décision,…) avec le logiciel SPAD

Quelles sont les fonctionnalités comprises dans le module Algorithme de Data Mining de SPAD ?

Segmentation par arbre de décision interactif

  • Discriminante et régression par arbre de décision selon les méthodes CART, CHAID, AID, C4.5 ;
  • Edition graphique spécifique pour visualiser et modifier de façon interactive un arbre de décision : élagage, choix des variables de coupure, modification des seuils, regroupement de modalités ;
  • Comparaison à tout moment de l’impact des modifications sur la qualité de l’arbre de décision par comparaison des matrices de confusion avant et après modifications interactives ;
  • Génération de règles SQL en mode « Select » ou « Update » à partir de l’arbre de décision initial ou modifié.

Typologies par arbre de décision avec ICT

  • Classification descendante hiérarchique utilisant conjointement les propriétés des analyses factorielles et des arbres de décision ;
  • Typologie basée soit sur des variables qualitatives (ACM préalable) soit sur des variables quantitatives (ACP préalable) ;
  • Résultats et interface graphique analogues aux arbres de décision.

Règles d’association

  • Recherche d’associations au sein de données transactionnelles (tickets de caisse). Possibilité de regrouper les données à chaud selon une table de recodages (Méta data) ;
  • Recherche des associations de modalités dans un tableau individus x variables ;
  • Editeur interactif pour sélectionner des règles selon des filtres statistiques ou des règles métiers.

Réseaux Bayésiens

  • Construction du réseau initial selon la méthode « Bayésien naïf », « parent caché », « augmenté par arbre de décision » ou « augmenté par forêt » ;
  • Editeur interactif du réseau permettant d’affiner le modèle selon des règles statistiques ou des règles métiers.

Réseaux de neurones

  • Classification ou régression par réseau de perceptron multicouches ;
  • Recherche automatique de la meilleure architecture du réseau ;
  • Plusieurs types de fonctions d’activation : tangente hyperbolique, sigmoïde, softmax, logarithmique ;
  • Algorithmes d’apprentissage performants : back propagation, resilient back propagation, scaled conjuged gradient… ;
  • Représentation graphique du réseau.

SVM (Support vector machines)

  • Classification ou régression par algorithmes de « séparateurs à vaste marge » (C-SVC – Nu-SVC / Epsilon-SVR – Nu-SVR) ;
  • Plusieurs types de noyaux : linéaire, polynomial, RBF, sigmoïde ;
  • Recherche automatique des valeurs optimales des paramètres ;
  • Visualisation graphique de la qualité du modèle.

Ce module est disponible à partir de la version SPAD Data Mining du logiciel SPAD.

En savoir +

Partager cette page :