SSAS : Cube Design and Performance Tuning

Du 17 Juin au 21 Juin 2013 j’étais à Londres pour une formation avancé de 3 jours sur SSAS avec Christopher Webb 🙂

Cette formation s’adresse aux développeurs SSAS de niveau intermédiaires – expérimentés souhaitant optimiser et concevoir des cubes multidimensionnels avancés.

Nous étions une dizaine « d’étudiants » en provenance d’Europe et de métiers assez différents (CIO, DSI, Développeur…)

J’ai beaucoup appris et conforté mes connaissances. La formation est ponctuée de cas concrets rencontrés par Chris lors de missions ce qui la rend super intéressante ! Petite déception le MDX a été abordé qu’à la fin et pas dans le détail 🙁 (Une autre formation lui est dédiée : http://www.technitrain.com/coursedetail.php?c=22)

La formation SSAS Maestro est peu à peu oubliée au profit d’une éventuelle certification MCM SSAS …

La formation

Je ne pourrais en aucun cas résumer dans un article la formation ! J’ai cependant essayé d’après mes notes de créer un mini référentiel de bonnes pratiques.

1er Jour :

À ton besoin d’un entrepôt de données (DWH) ?

Ralph Kimball

Schémas en étoile vs Schémas en flocon ?

Natural vs Surrogate Keys ?

ETL vs Views vs DSVs ?

DSV

Named Queries

Plus généralement :

SSAS Online Mode

TFS

http://bidshelper.codeplex.com

Nous avons fini ce premier jour de formation par une longue discussion sur les qualités / défauts d’un gros cube vs plusieurs petits cubes, en gros : Ca dépend !

2eme Jour :

Distincts Counts

Récemment un client m’a demandé cela, et malgré mes alertes…

Notez que BIDS nous indique par un soulignement un Warning : « Break distinct count measures into separate measure groups. »

Account Aggregation

Déploiement

Partitionnement

Plus généralement :

SSAS Database Syncrhonize

3eme Jour :

J’attendais avec impatience cette journée, au programme : Architecture de SSAS et Optimisation de cube !

Plan d’exécution : SSAS est constitué de deux moteurs

SSD

Lors de l’exécution le Formula Engine créer des Subcubs (tranches de données du cube définit pour une granularité) et envoie au Storage Engine la requête. Le Storage Engine vérifie si les données sont en cache, sinon il ira les lire sur le disque (ce qui est plus long). Il va vérifier s’il peut obtenir les données à partir d’une agrégation existante, s’il ne peut pas il va descendre jusqu’à la granularité la plus fine pour les agrégés (utilisation de la CPU).

Un bon article de Chris : Ici.

Querry Tunning

Profiler : De plus en plus d’événements sont disponibles dans le Profiler concernant SSAS

Cache-Warmer

SQLIs

CWebbBI

Formatmdx

Plus généralement :

http://asstoredprocedures.codeplex.com/

Déjà la fin !

Ma formation à Londres s’est finie en musique puisqu’après avoir rencontré une CouchSurfeuse d’Argentine nous sommes allés à un Crawl Bar histoire de découvrir Londres de nuit 😉

Je tiens à remercier Chris Webb pour cette super formation, l’ambiance était studieuse et les conditions excellentes. Enfin merci à ma société Dcube pour m’avoir permis d’y assister.

C’est avec grand plaisir que je retournerai à Londres pour d’autres formations !

2 Comments

fbrossard Says

Salut Romain,
Très bon article rappelant les fondamentaux de design dwh/ssas.
Au passage, j’ai bien aimé les paragraphes :
– Etoile Vs Flocon : et oui les flocons sont à éviter, on ne le répétera jamais assez
– Natural Vs Surrogate Keys : il faut vraiment insister sur ces principes de modélisation qui ne sont pas toujours respectées
– ETLS Vs View Vs DSV : tiens çà me rappelle un article çà 😉
Pour les parent/child hierachies, j’ajouterai qu’il est toujours préférable de les aplatir (tous comme les flocons) surtout si la profondeur est connue (c’est marrant mais il n’y a pas d’autres façon de le faire en Tabular); l’utilisation des vues est à mon sens de bonne augure dans ce cas (via une CTE par exemple).
Concernant les Distinct Count, je comprends le point de vue des utilisateurs, le fait d’avoir un groupe de mesure dès qu’on déclare une mesure de ce type ne fait que « complexifier » le modèle exposé. Mais il ne faut en aucun cas supprimer ces groupes de mesures alors comment respecter les bonnes pratiques tout en répondant aux attentes utilisateurs : tout simplement en masquant les mesures DistinctCount et en les utilisant via des mesures calculées rattachées aux « bons » groupes.

@+
Fred.

On 23 juillet 2013 at 8 h 04 min
Chris Webb Says

Thanks for your kind words Romain, I’m glad you enjoyed it!

On 25 juillet 2013 at 10 h 55 min

Comments are closed.

La formation

1er Jour :

2eme Jour :

3eme Jour :

Déjà la fin !

Related Posts

Taille des modèles dans Power BI Report Server

Power BI Gateway : Haute disponibilité et Load Balancing

Linked Server SSAS

2 Comments

En savoir plus sur Pulsweb - Romain Casteres