Analytics & Data IntelligenceData-mining & Business Analytics

Coheris Analytics Spad
Le Logiciel Data-Mining

icon_dl

Télécharger la fiche produit Coheris Analytics savoir +Spad

Coheris Spad offre une large palette de méthodes de mesure de la satisfaction client
Justin Parchantour
Statistics & Data Warehousing Manager
Sodexo
Coheris SPAD nous permet de réaliser des analyses bi-variées, qui projettent sur un plan orthonormé des données afin d’observer la réalité d’un secteur d’activité. C’est très pratique pour faire apparaitre les principales informations sans avoir à faire des recoupements de dizaine de tableaux. Le résultat est un gain en termes d’efficacité, d’économie de temps, mais aussi de clarté des messages que nous pouvons faire passer.
Virgile Adjahi
Chef de projet au sein du pôle veille Economique
Conseil Général de Seine Saint-Denis

Coheris Analytics SPAD : une solution puissante pour analyser toutes les données et activer de réels leviers de croissance

Logiciel data-mining Coheris Analytics SPAD, pour être au coeur de la statistique

Le logiciel data-mining Coheris Analytics SPAD propose des solutions adaptées à chaque besoin. La montée en gamme des solutions SPAD suit le cheminement logique de la démarche statistique : la gestion des données en vue de la création d’un fichier destiné à l’analyse statistique, puis une première approche exploratoire et descriptive à une approche décisionnelle globale et prédictive pour la mise en place d’actions concrètes.

Découvrez toutes les fonctionnalités du logiciel data-mining SPAD classées par module :

logiciel-data-mining

Le logiciel data-mining Coheris Analytics SPAD permet, par l’exploration de larges volumes de données, d’extraire des informations stratégiques pour la prise de décision.

Data management

  • Accès et exportation de fichiers texte en format fixe ou délimité, Excel, SPSS…
  • Accès et exportation de principales bases de données : Oracle, DB2, Sybase, SAS monoposte ou SAS Server, SQL Server… Accès ODBC aux autres bases de données
  • Accès simultané à plusieurs sources de données telles que SPSS et R
  • Typage automatique des variables, gestion des données manquantes
  • Requêtes SQL sur bases de données
  • Ajout, insertion et mise à jour de tables dans une base de données
  • Jointure, empilement, juxtaposition de tables, dédoublonnage, tri
  • Agrégation, transposition, verticalisation, horizontalisation, agrégation par tableaux croisés
  • Bibliothèque complète de fonctions de transformation pour la création de nouvelles variables en mode assisté
  • Langage de programmation Python
  • Recodages statistiques : mise en classes, regroupements de modalités, croisement de plusieurs variables, binarisation, standardisation, transformation en rangs…
  • Gestion des libellés, bibliothèque de formats
  • Redressement (méthode RAS)
  • Archivage des prédictions (score, régression, segmentation, typologies)
  • Archivage d’un modèle prédictif, industrialisation de modèles

Statistiques descriptives

Analyses descriptives
  • Tris à plat, histogrammes, tableaux croisés, analyse bivariée
  • Galerie Graphique pour l’étude des distributions des variables
  • Caractérisations automatiques de variables continues ou nominales par le reste de l’information
  • Analyse graphique bivariée
  • Tests statistiques
  • Matrice importance satisfaction
  • Statistiques avec R
  • Marquage sémantique
Analyses factorielles
  • Analyse en Composantes Principales (ACP)
  • Analyse des Correspondances Multiples (ACM)
  • Analyse Factorielle des Correspondances (AFC)
  • Aide à l’interprétation des axes factoriels
  • Editeur exceptionnel de graphiques factoriels, mappings, puissant et interactif.
Typologies
  • CAH, Classification mixte, partitions optimales, Description des classes, Application de la typologie à d’autres individus …
Amado
  • Module de traitement graphique des données basé sur la complémentarité des techniques d’analyses factorielles et des méthodes graphiques de J. Bertin.

Modélisation

Modèles prédictifs
  • Régressions simples et multiples
  • Analyse de variance et de la covariance (ANOVA et ANCOVA)
  • Modèle linéaire général
  • Régression PLS
  • Régression logistique
  • Régression et discriminante optimales – Furnival et Wilson
  • Analyse discriminante sur variables quantitatives
  • Analyse discriminante sur facteurs principaux
  • Analyse discriminante sur variables qualitatives (DISQUAL)
  • Réseaux de neurones (perceptron multi-couches)
  • Réseaux bayésiens
Fonctions de score
  • Echelle des scores définie par l’utilisateur
  • Modèle additif simple, intelligible et modifiable par l’expert métier
  • Optimal Scoring Pilot : choix visuel et interactif des seuils de score (refus, indécision, acceptation)
  • Courbe de gains (lift), courbe de Roc, comparaison de modèles

Segmentation

Discriminantes et régressions par arbres de décision interactifs
  • Méthodes CART, CHAID, C4.5
  • Critères d’arrêt : nombres de niveaux de l’arbre, effectif minimum pour diviser un segment, seuil de spécialisation
  • Analyse automatique ou interactive
  • Caractéristiques générales de l’arbre et matrice de confusion
  • Edition d’un rapport général sur l’arbre au format html
  • Edition des règles de décision en mode “Select” ou “Update” au format SQL selon le SGBD (Oracle, Access…)
Typologies par arbres de décision avec ICT
  • Classification descendante hiérarchique utilisant conjointement les propriétés des analyses factorielles et des arbres de décision
  • Résultats et interface graphique analogues aux arbres de décision

Règles d’association

  • Recherche d’associations au sein de données transactionnelles (tickets de caisse)
  • Recherche des associations de modalités dans un tableau individus x variables

Tableaux Multiples

AFM : Analyse Factorielle Multiple
  • Exploration des données au-delà des analyses de données classiques en exploitant la notion de « groupes de variables »
  • Analyses partielles et analyse globale
STATIS
  • Méthodes STATIS, STATIS Duale et Triadique de Jaffrenou
  • Groupes de variables continues actives

Text Mining

  • Traitement simultané d’une ou plusieurs variables textuelles
  • Construction du vocabulaire : mots et segments répétés (suite de mots)
  • Modification du vocabulaire avec un lemmatiseur semi-automatique
  • Edition des statistiques sur les mots et segments répétés
  • Edition des contextes de mots
  • Caractérisation de sous populations par un vocabulaire spécifique : mots et phrases caractéristiques
  • Création d’un tableau lexical de contingence,
  • Analyse des correspondances simples sur tableau lexical et classification
  • Création d’une base SPAD comprenant les Variables initiales, les mots et les segments en colonnes

Question

  • Création de questionnaires, utilisation de bibliothèques de questions
  • Création automatique de masques de saisie avec contrôles de cohérence
  • Définition des enchaînements de questions par filtres multicritères
  • Définition de plans de tri pour l’automatisation d’enquêtes récurrentes
  • Tris à plat et tris croisés complets avec édition automatique de tableaux et graphiques dans Excel, Word, html
  • Bilans d’image avec la méthode SATIMIX
  • Fusion des fichiers et fichiers hiérarchisés

PLS Path Modeling

  • Modélisation d’équations structurelles sur variables latentes
  • Définition manuelle ou graphique du modèle
  • Mode d’estimation interne : structurel, factoriel, centroïde
  • Régression classique ou PLS entre variables latentes
  • Gestion des données manquantes : moyennes, NIPALS
  • Normalisation des données et des poids (au choix)
  • Estimation des intervalles de confiance par bootstrap, jacknife
  • Validation du modèle global,
  • Visualisation graphique des résultats des modèles interne et externe

logiciel-data-mining-screeshot-1

logiciel-data-mining-screeshot-2
Le Profiling pour préparer les données, les explorer et les découvrir. Celui-ci sert à contrôler la validité des données, les transformer et calculer de nouveaux indicateurs ou agrégats, explorer et découvrir les principales caractéristiques et liaisons qui structurent les données (statistiques descriptives univariées et bivariées, analyses factorielles, typologies, caractérisations automatiques des axes et des classes…).
Le logiciel Data-Mining SPAD Profiling comprend l’ensemble des méthodes de data management, d’analyses descriptives et exploratoires qui font de SPAD la référence mondiale pour l’analyse multidimensionnelle des données.

Composition du pack :

  • Le Data Management
  • Statistiques Descriptives

logiciel-data-mining-screeshot-4

Le Scoring, pour une première approche prédictive. Il sert à expliquer, modéliser et prédire des variables quantitatives, affecter des scores ou des probabilités d’appartenance à un groupe.
Les méthodes de SPAD Scoring sont le complément indispensable des analyses exploratoires. Elles permettent de modéliser et de prévoir les phénomènes mis en évidence grâce aux analyses factorielles et typologiques.
SPAD Scoring reprend l’ensemble des fonctionnalités de SPAD Profiling et intègre une première partie des techniques d’analyse prédictive.

Composition du pack :

  • Le Data Management
  • Statistiques descriptives
  • Modélisation et Scoring

logiciel-data-mining-screeshot-3

SPAD data-mining sert à :

  • Expliquer et prédire des phénomènes par la technique des arbres de décision interactifs : méthode puissante fournissant les résultats sous forme de règles particulièrement simples à interpréter et à réutiliser.
  • Analyser les tickets de caisse, rechercher des associations de produits ou les associations au sein d’une base de données avec la méthode des règles d’association.
  • Construire des typologies par arbre de décision en une seule étape et ainsi profiter des propriétés des arbres de décision : interactivité, règles logiques d’appartenance aux segments…
  • Analyser simultanément plusieurs tableaux de données avec les méthodes AFM et Statis : analyses sensorielles, évolution de tableaux au cours du temps, comparaisons globales d’enquêtes…

SPAD Data Mining reprend toutes les fonctionnalités du logiciel data-mining SPAD Profiling et de SPAD Scoring et intègre en complément les arbres de décisions interactifs, les règles d’association et l’analyse des tableaux multiples.

Composition du Pack :

  • Data Management
  • Statistiques descriptives
  • Modélisation et Scoring
  • Segmentation
  • Règles d’association
  • Tableaux multiples

logiciel-data-mining-screeshot-5

Le pack intégral sert à traiter toute l’information et notamment l’information textuelle. La grande force du Text Mining avec SPAD est le traitement en parallèle des données numériques classiques et des données textuelles, ces deux sources de données s’enrichissant mutuellement.
Le logiciel data-mining SPAD Intégral reprend les fonctionnalités de SPAD Profiling, Scoring et Data Mining et intègre en complément l’analyse de données textuelles (Text Mining) ainsi qu’un outil dédié au traitement d’enquêtes : SPAD Question.
SPAD Intégral est la solution la plus complète de la gamme SPAD.

Composition du pack :

  • Le Data Management
  • Statistiques descriptives
  • Modélisation et Scoring
  • Segmentation
  • Règles d’association
  • Tableaux multiples
  • Text Mining
  • Question