Gestion des données, Recodage, Création de variables et Industrialisation de modèles

grâce au Module Data Management de Coheris SPAD

Module Data Management

Quelles sont les fonctionnalités comprises ?

Le logiciel data mining Coheris Analytics SPAD intègre les méthodologies de Data Management suivantes :

Gestion des données

  • Accès aux fichiers Texte en format fixe ou délimité, Excel, Access, SPSS, Triple-S ;
  • Accès natif aux principales bases de données : Oracle, DB2, MS SQL Server, MySQL, SAS monoposte/serveur, Teradata, Sybase, PostgreSQL, Hadoop (Hive)… Accès ODBC aux autres bases de données ;
  • Accès simultané à plusieurs sources de données ;
  • Requêtes SQL sur base de données ;
  • Ajout, insertion et mise à jour de tables dans une base de données ;
  • Typage automatique des variables, gestion des libellés, bibliothèque de formats ;
  • Jointure, empilement, juxtaposition, dédoublonnage, tri ;
  • Agrégation, transposition, verticalisation, horizontalisation, agrégation par tableaux croisés ;
  • Création de sous-populations par filtre logique, tirage aléatoire simple ou stratifié ;
  • Gestion des données manquantes pour les variables qualitatives et quantitatives, algorithme de type EM pour les variables quantitatives ;
  • Le Data Management permet la validation des données : recherche des distributions atypiques, des « outliers », des variables quantitatives quasi constantes, des individus contenant trop de données manquantes ; Gestion des questions multiples.

Recodages & création de variables

  • Recodages statistiques : mise en classes, regroupement de modalités, croisement de variables, binarisation, standardisation, transformation en rangs ;
  • Bibliothèque complète de fonctions de transformation pour la création de variables en mode assisté ;
  • Recodages supervisés (mise en classes, regroupement de modalités, sélection automatique de variables) ;
  • Redressement d’échantillon sur marges (méthode RAS).

Langages externes

  • Accès au langage de programmation Python ;
  • Accès au langage statistique R avec possibilité de créer des interfaces de paramétrage.

Archivage et industrialisation des modèles

  • Le Data Management permet l’archivage des prédictions issues des méthodes de modélisation statistique et de Data Mining ;
  • L’archivage des axes factoriels et des typologies ;
  • L’archivage des modèles sous forme de règles pour les méthodes de modélisation statistique, les algorithmes de Data Mining, les analyses factorielles et les typologies ;
  • L’application des règles sur de nouvelles données importées dans SPAD ou sur une base de données externe via Coheris SPAD Real-Time.

Tirez le meilleur parti de tous vos fichiers

  • Fichiers clients, abonnés, administrés…
  • Données d’enquêtes
  • Données RH
  • Données industrielles

3 approches complémentaires

  • Analyse exploratoire des données
  • Analyse prédictive et Data Mining
  • Text Mining

Avantages de la solution

  • Ergonomie intuitive (pas de programmation)
  • Puissance de son moteur de calcul
  • Facilité d’utilisation et de prise en main
  • Qualité de représentation des résultats (graphiques et Excel)

Télécharger les fiches produits

Les fonctionnalités Analytics SPAD

Essai gratuit

Installez la version gratuite de 30 jours pour mesurer la richesse méthodologique et fonctionnelle de la solution de Data Mining, Coheris Analytics SPAD.

Industrialisez vos modèles prédictifs

Gagnez du temps en modélisation et en exécution de chaque analyse prédictive

Recommandations en temps réel

Coheris SPAD Real-Time est un serveur décisionnel qui traite les données pour améliorer la réactivité globale de l’entreprise.

Module Text Mining

Coheris Analytics SPAD est dôté du module Text Mining, qui est donc chargé d’analyser les données textuelles et permettant de les traiter simultanément à...

Arbre de décision & Algorithmes de Data Mining

Le logiciel SPAD dispose d’un module dédié à l’arbre de décision composé de la segmentation par arbre de décision interactif, des typologies par ...

Module Modélisation Statistique

Restez au cœur de la décision et optez pour la modélisation statistique. Grâce à ce module du logiciel SPAD, vous pourrez développer des modèles..

Module Analyses factorielles et typologies

La solution Coheris Analytics SPAD est dotée de l'analyse factorielles et l'analyse en composantes principales. Egalement, les typologies enrichissent vos..

Module Statistique Descriptive

Grâce au module Statistique descriptive et tests, la solution Coheris Analytics SPAD offre la visualisation graphiqe des données, le tri, la caractéris...

Coheris Analytics SPAD Intégral

Solution complète pour l'analyse de données, SPAD Intégral intègre l'ensemble des fonctionnalités profiling, data mining, et analyse de données textuelles.