Module Data Management
Quelles sont les fonctionnalités comprises ?
Le logiciel data mining Coheris Analytics SPAD intègre les méthodologies de Data Management suivantes :
Gestion des données
- Accès aux fichiers Texte en format fixe ou délimité, Excel, Access, SPSS, Triple-S ;
- Accès natif aux principales bases de données : Oracle, DB2, MS SQL Server, MySQL, SAS monoposte/serveur, Teradata, Sybase, PostgreSQL, Hadoop (Hive)… Accès ODBC aux autres bases de données ;
- Accès simultané à plusieurs sources de données ;
- Requêtes SQL sur base de données ;
- Ajout, insertion et mise à jour de tables dans une base de données ;
- Typage automatique des variables, gestion des libellés, bibliothèque de formats ;
- Jointure, empilement, juxtaposition, dédoublonnage, tri ;
- Agrégation, transposition, verticalisation, horizontalisation, agrégation par tableaux croisés ;
- Création de sous-populations par filtre logique, tirage aléatoire simple ou stratifié ;
- Gestion des données manquantes pour les variables qualitatives et quantitatives, algorithme de type EM pour les variables quantitatives ;
- Le Data Management permet la validation des données : recherche des distributions atypiques, des « outliers », des variables quantitatives quasi constantes, des individus contenant trop de données manquantes ; Gestion des questions multiples.
Recodages & création de variables
- Recodages statistiques : mise en classes, regroupement de modalités, croisement de variables, binarisation, standardisation, transformation en rangs ;
- Bibliothèque complète de fonctions de transformation pour la création de variables en mode assisté ;
- Recodages supervisés (mise en classes, regroupement de modalités, sélection automatique de variables) ;
- Redressement d’échantillon sur marges (méthode RAS).
Langages externes
- Accès au langage de programmation Python ;
- Accès au langage statistique R avec possibilité de créer des interfaces de paramétrage.
Archivage et industrialisation des modèles
- Le Data Management permet l’archivage des prédictions issues des méthodes de modélisation statistique et de Data Mining ;
- L’archivage des axes factoriels et des typologies ;
- L’archivage des modèles sous forme de règles pour les méthodes de modélisation statistique, les algorithmes de Data Mining, les analyses factorielles et les typologies ;
- L’application des règles sur de nouvelles données importées dans SPAD ou sur une base de données externe via Coheris SPAD Real-Time.
Ce que nos clients pensent de nos solutions
Actualités Analytics SPAD
Plus d’informations ?
Les fonctionnalités Analytics SPAD
Essai gratuit
Installez la version gratuite de 30 jours pour mesurer la richesse méthodologique et fonctionnelle de la solution de Data Mining, Coheris Analytics SPAD.
Industrialisez vos modèles prédictifs
Gagnez du temps en modélisation et en exécution de chaque analyse prédictive
Module Text Mining
Coheris Analytics SPAD est dôté du module Text Mining, qui est donc chargé d’analyser les données textuelles et permettant de les traiter simultanément à...
Arbre de décision & Algorithmes de Data Mining
Le logiciel SPAD dispose d’un module dédié à l’arbre de décision composé de la segmentation par arbre de décision interactif, des typologies par ...
Module Modélisation Statistique
Restez au cœur de la décision et optez pour la modélisation statistique. Grâce à ce module du logiciel SPAD, vous pourrez développer des modèles..
Module Analyses factorielles et typologies
La solution Coheris Analytics SPAD est dotée de l'analyse factorielles et l'analyse en composantes principales. Egalement, les typologies enrichissent vos..
Module Statistique Descriptive
Grâce au module Statistique descriptive et tests, la solution Coheris Analytics SPAD offre la visualisation graphiqe des données, le tri, la caractéris...
Coheris Analytics SPAD Intégral
Solution complète pour l'analyse de données, SPAD Intégral intègre l'ensemble des fonctionnalités profiling, data mining, et analyse de données textuelles.
Coheris Analytics SPAD Data mining
Au cœur de la décision, le data mining vous apporte la modélisation, le profiling ainsi que la segmentation des données.