Introduction
SAP continue de développer fortement son offre de reporting en mode Cloud à travers « SAP Analytics Cloud », anciennement SAP BusinessObjects Cloud « BOC », un Software-as-a-Service (SaaS) permettant de manipuler et de présenter vos données rapidement et intuitivement.
Nous vous avions présenté SAP Analytics Cloud dans un précédent article (SAP BusinessObjects Cloud : présentation, fonctionnalités…). A cette occasion, nous avions constaté la valeur ajoutée de l’outil et la possibilité, pour les décideurs, de pouvoir, rapidement et simplement, manipuler et présenter leurs données. De plus, SAP Analytics Cloud étant hébergé sur le Cloud et disponible en SaaS, son utilisation ne nécessite pas d’architecture spécifique et peut répondre à certaines problématiques liées à l’itinérance des collaborateurs.
Au-delà du grand nombre de fonctionnalités disponibles, dont les principales se retrouvent d’ailleurs sur Web Intelligence, nous pouvons nous poser la question : quelle est la plus-value de cette solution Cloud ?
SAP Analytics Cloud se démarque grâce à ses fonctionnalités dites « intelligentes ». En effet, il permet d’analyser vos données grâce à des algorithmes prédictifs et du machine learning afin d’enrichir les analyses et de mieux comprendre l’articulation de ces données.
Smart Discovery
La fonction Smart Discovery (ou Découverte Intelligente) s’appuie sur les technologies de machine learning et permet ainsi aux utilisateurs d’obtenir de puissantes analyses sans avoir à maitriser la data science.
Cette fonctionnalité permet de découvrir les influenceurs clés de nos mesures et dimensions, mais aussi de mettre en valeur d’éventuelles corrélations entre les données.
Afin d’accéder à cette fonctionnalité, passez vos présentations en mode « Données » puis sélectionnez « Nouvelle découverte intelligente ».
Un récapitulatif de votre jeu de données vous sera présenté et vous pourrez choisir une colonne cible, qui sera l’objet de la découverte intelligente. Il est aussi possible de sélectionner des colonnes qui seront exclues de l’analyse et d’appliquer des filtres pour se focaliser uniquement sur certaines valeurs de votre jeu de données (uniquement l’année 2018 par exemple).
A noter que SAC affiche le nombre de colonnes disponibles ainsi que le nombre d’enregistrement, très utile pour voir l’impact de vos filtres avant exécution de l’algorithme.
Pour cet article, nous allons utiliser un jeu de données relatif aux informations sur les vols de plusieurs compagnies aériennes. Pour analyser l’empreinte carbone, nous allons effectuer une découverte intelligente sur cette mesure.
Nous obtenons ainsi une première page offrant quelques informations numériques :
- Une note sur la qualité de l’analyse
- Le nombre de colonnes corrélées
- Les influenceurs clés
- Le décompte des valeurs inattendues
Dans notre exemple, nous avons une qualité d’analyse jugée bonne par l’algorithme avec une note de 4/5. De plus, celui-ci a identifié une colonne corrélée à notre empreinte carbone, le kilométrage. Cette information est disponible en cliquant sur l’indicateur de « Colonnes corrélées ». Enfin, 98 valeurs inattendues ont été identifiées, cela correspond à des valeurs qui sont éloignées de la prédiction faite par l’algorithme.
Les influenceurs clés
Le premier graphique proposé, sous forme de bar chart, affiche les 10 influenceurs clés ainsi que leur impact dans la mesure analysée. Un influenceur est une dimension ou mesure qui a un fort impact sur l’analyse de la mesure choisie, ici l’empreinte carbone.
Notre avis : Avoir une vision des influenceurs clés des données en notre possession est un élément essentiel ; cela nous permet de mieux comprendre comment interagissent nos données.
Graphiques complémentaires
Afin d’afficher d’autres graphiques et d’avoir une analyse plus approfondie, il faut sélectionner un des influenceurs clés au sein du graphique. Les ampoules laisseront alors leur place à de nouvelles représentations.
Ainsi, en sélectionnant l’influenceur principal (le montant des tickets), nous obtenons un graphique analysant l’empreinte carbone par intervalle de montant des tickets ainsi qu’une ligne de référence représentant la moyenne. Il est possible de modifier cette analyse afin de visualiser le nombre d’enregistrement au-dessus et en dessous de la moyenne.
Des informations textuelles clés vous sont également présentées, par exemple le pourcentage d’enregistrement au-dessus de la moyenne.
En sélectionnant un second influenceur clé de notre analyse, la 3ème ampoule laisse sa place à une carte de chaleur (« heatmap »). De nouvelles informations numériques clés sont aussi affichées.
Pour notre exemple, nous choisissons de comparer les vols domestiques et les vols internationaux. Ainsi, nous aurons une analyse croisée entre le type de vol et le montant des tickets. Nous pouvons ici déduire que les vols internationaux ont une empreinte carbone plus élevée que les vols domestiques. De plus, plus le prix du billet est élevé, plus l’empreinte carbone a tendance à augmenter.
Notre avis : Cette fonctionnalité permet de mettre en avant très rapidement une tendance au sein des données. Il est essentiel d’utiliser des axes d’analyse pertinents, dans le cas contraire le graphique généré ne présenterait que peu d’intérêt.
Les valeurs inattendues
Une autre fonctionnalité de la découverte intelligente est l’affichage des valeurs inattendues. Cela permet de visualiser les données qui n’avaient pas été prévues par l’algorithme. Vous disposez ainsi d’une vision complète sur ces valeurs afin de les replacer dans leur contexte vis-à-vis des autres dimensions d’analyse. En effet, SAC affiche la valeur prédite ainsi que la valeur réelle, l’écart entre les deux et l’ensemble des données liées à cette valeur.
De plus, deux graphiques sont mis à votre disposition. Le premier, un nuage de points, permet d’identifier de manière visuelle les écarts entre les valeurs prédites et les valeurs existantes. Le second, un graphique en barre, vous permet de visualiser chaque mesure prédite et sa mesure réelle.
La simulation
Enfin, la dernière fonctionnalité proposée par l’outil de découverte intelligente est la simulation. Elle permet de spécifier des valeurs aux influenceurs clés afin de déterminer la valeur attendue de la mesure faisant l’objet de l’analyse.
Outre la valeur attendue, SAC vous affiche la décomposition par influenceurs clés du résultat permettant ainsi de prendre en considération le poids de chacun de ces influenceurs clés.
Notre avis : Cette fonctionnalité est intéressante car elle permet d’avoir une vision sur les valeurs qui influencent vos données et ainsi vous aiguiller sur vos décisions.
Smart Insight
La fonction Smart Insight (ou Analyse Intelligente) permet d’obtenir des informations complémentaires sur un point de données. Il est ainsi possible de voir les meilleurs contributeurs pour ce point de données ou encore de situer la valeur en fonction de la moyenne des autres valeurs. Cette fonctionnalité est uniquement disponible sur les graphiques.
Dans l’exemple ci-dessous, nous analysons le kilométrage effectué par les alliances de compagnies aériennes. Afin d’obtenir la fonctionnalité Smart Insight, il faut sélectionner un point de données puis l’ampoule. Ici, c’est le kilométrage effectué par « StarAlliance » qui est analysé.
Un menu contextuel apparait et vous informe des meilleurs contributeurs de la mesure sélectionnée pour la dimension choisie. Nous pouvons voir par exemple que le meilleur contributeur au kilométrage par alliance de compagnie aérienne est la classe économique.
Un graphique associé à cette information est aussi proposé et il est possible de l’ajouter directement à votre présentation. Chaque information proposée dispose d’un graphique associé afin d’enrichir vos analyses.
Notre avis : Cette fonctionnalité permet de visualiser les meilleurs contributeurs de nos données et la suggestion de graphiques peut s’avérer intéressante pour ajouter des éléments auxquels vous n’auriez pas pensé initialement.
Search to Insight
La fonctionnalité Search to Insight (ou Recherche dans l’Analyse) permet d’obtenir des analyses en utilisant le langage naturel. En effet, cette option permet d’écrire du texte dans un champ et d’obtenir les analyses demandées sous forme d’indicateur numérique ou de graphique. Cela s’appuie sur une technologie d’intelligence artificielle conversationnelle.
A l’heure actuelle, cette fonctionnalité n’est opérationnelle qu’en langue anglaise et uniquement pour les données importées dans le cloud.
Cette fonctionnalité est utilisable à partir de vos présentations en cliquant sur l’icône de loupe en haut à droite.
Il suffit ensuite d’écrire une phrase ou de poser une question et SAC interprètera cette dernière ou vous proposera d’autres suggestions.
Il est possible de rajouter des mots clés au sein de vos demandes en demandant par exemple de classer et trier les résultats affichés (mots clés : Rank et Sort) ou encore d’explorer des hiérarchies en précisant le niveau de granularité désiré. De plus, le mot clé Describe associé au nom du modèle permet d’obtenir une vue d’ensemble du jeu de données afin de visualiser l’ensemble des mesures et dimensions.
Dans le cas d’une présentation multi-modèle, il peut être nécessaire de préciser le modèle à utiliser dans le cas de dimensions communes.
SAP a annoncé de nouvelles fonctionnalités à venir telles que le support des connectivités live sur les modèles de données SAP HANA, S4/HANA, SAP BW et les univers. Les recherches globales seront possibles et l’utilisateur ne sera plus cloisonné aux uniques modèles de la présentation en cours d’utilisation. Enfin, cette fonctionnalité sera bientôt disponible au sein du SAP Digital Boardroom et SAP Analytics Cloud Mobile App.
Notre avis : Cet outil est très prometteur mais est à l’heure actuelle peu mature et les fonctionnalités sont encore limitées. Une prise en charge d’autres langages serait par exemple un vrai plus.
Smart Clustering
La fonctionnalité Smart Clustering (ou Regroupement Intelligent) permet de créer des ensembles de points au sein d’un graphique à bulle ou d’un nuage de points afin de regrouper des points de données présentant des caractéristiques communes. Cela permet de dégager certaines tendances au sein des graphiques.
Afin d’appliquer un regroupement intelligent, il faut activer l’option dans le panneau de conception. Il est ensuite nécessaire de spécifier le nombre de groupe que l’on souhaite voir apparaitre sur notre représentation graphique et éventuellement de modifier l’étiquette du groupe.
Une fois ces paramètres renseignés, un algorithme va définir différents groupes.
Ici, nous avons un graphique à bulle analysant le montant des tickets par kilométrage avec une taille de bulle pondérée par le nombre de ticket. Les différents points de données représentent les compagnies aériennes.
Comme nous pouvons le constater, l’algorithme a automatiquement déduit des groupes de points ayant des caractéristiques similaires. Par exemple, le groupe 2 (en orange) correspond aux deux compagnies aériennes ayant engrangé le plus de revenus sur les montants de tickets mais aussi ayant parcouru le plus de kilomètres.
Notre avis : Cette fonctionnalité est intéressante et relativement facile à mettre en place car elle ne nécessite que peu de paramétrage. Il est ainsi aisé d’obtenir rapidement des groupes de points de données afin d’identifier des ensembles homogènes au sein de notre jeu de données.
Forecast
L’outil de prévision est disponible uniquement sur les séries temporelles et les courbes. Il permet de prédire des données futures en se basant sur les données déjà présentes au sein du graphique initial.
Plusieurs options sont disponibles pour définir une prévision. Tout d’abord, la prévision automatique va utiliser les données disponibles et l’algorithme va tester différentes prévisions et déterminer celle qui est la meilleure. Autre option disponible, le lissage exponentiel triple est une méthode statistique de prévision sur des données chronologiques. Ainsi, des calculs statistiques peuvent aussi être employés afin de faire de la prévision.
Enfin, la dernière option consiste à enrichir le jeu de données avec des paramètres supplémentaires pour affiner les prévisions. Par exemple dans le cas où l’on analyse l’évolution des ventes de voitures, il peut être intéressant d’ajouter d’autres paramètres tels que les réductions faites par les vendeurs.
Les prévisions sont notées par l’outil lui-même afin de juger de la qualité de ces prévisions. Dans le cas idéal d’une note de 5/5, on peut considérer que les données sont fiables dans un intervalle de confiance à 95%.
Notre avis : Cette fonctionnalité présente un intérêt certain, toutefois il est essentiel d’avoir du recul sur le sujet d’analyse et de prêter une attention toute particulière à la note des prévisions sous peine d’avoir une prévision peu fiable.
CONCLUSION DE L’EXPERT
L’outil SAC est en perpétuelle évolution, il apporte de nouvelles fonctionnalités innovantes par rapport à l’outil historique de SAP, Web Intelligence. Si certaines de ces fonctionnalités sont à prendre avec précaution, comme par exemple le Search Insight qui manque encore de maturité ou les prévisions qui peuvent induire en erreur, d’autres nouveautés peuvent apporter de nouvelles perspectives à vos analyses, notamment la fonction Smart Discovery, très complète et efficace.
Nous vous invitons à découvrir le comparatif entre SAP Analytics Cloud, Web Intelligence et Lumira Discovery que nous avons réalisé.
Attention, il faut prendre en compte que la plupart des fonctionnalités disponibles dans SAC ne permettent pas de paramétrages personnalisés (Clustering, Forecast, …). Cependant, SAP propose déjà des évolutions pour pallier à ce désavantage : par exemple, Smart Predict, l’équivalent Cloud de l’outil SAP Predictive Analytics, est lui entièrement paramétrable (choix et validation des modèles, intégration de script en langage R, …).
Avec ces Smart Features, SAP propose donc des solutions innovantes et intelligentes aux utilisateurs désireux de pouvoir, rapidement et simplement, explorer et présenter leurs données.