‹ Retour au blogue

Communauté de pratique numérique | Exploiter les données issues d’une plateforme de billetterie avec Airtable

Comme nous l’avons expliqué dans le premier texte de cette série, les données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses. Le deuxième texte de la série nous a permis de voir comment le Carrefour international de théâtre exploite ces données à travers des tableaux de bord réalisés avec la solution Google Data Studio.

Ce troisième et dernier (pour l’instant!) texte de la série s’attarde à l’approche retenue par Le théâtre du Trident, qui a choisi d’utiliser la plateforme Airtable pour exploiter ses données de ventes. L’équipe du Trident a été accompagnée par un conseiller de la Communauté de pratique numérique de CCNCA (CPN) pour développer la preuve de concept de la solution.

Point de départ

Les données concernant les ventes et la clientèle du Trident sont stockées dans sa plateforme de billetterie.

Le Trident souhaitait se doter de moyens…

  • d’enrichir les données concernant la clientèle, par exemple par l’ajout d’étiquettes (« tags ») permettant d’identifier des clients fidèles, des donateurs, etc.
  • de générer des listes de clients en fonction de différents critères (les étiquettes, clients abonnés, acheteurs de tel ou tel spectacle, etc.)
  • d’identifier ses clients et ses abonnés fidèles
  • de conserver une copie des précieuses informations relatives à ses ventes et à ses clients dans une plateforme indépendante de la plateforme de billetterie, et qui soit pérenne même en cas de changement de solution de billetterie.

Des premières recherches réalisées en interne avaient permis à l’équipe d’identifier Airtable comme solution possible. L’équipe avait fait des tests préliminaires d’Airtable sur un petit jeu de données.

Analyse, conception et prototypage

Avant de démarrer les travaux, une phase d’analyse plus détaillée a été réalisée par l’équipe du Trident et le conseiller de la CPN. Ces travaux ont permis d’identifier certains défis qui devraient être relevés dans la mise en place d’une solution.

Le premier défi est l’absence de mécanismes qui permettent d’extraire les données de façon automatisée de la plateforme de billetterie (par exemple, une API). Cela fait en sorte qu’il est impossible de synchroniser les données de façon automatique et en temps réel depuis la billetterie vers un autre système. Il faut donc imaginer un processus qui implique forcément une intervention humaine, mais qui la simplifie au maximum (pour gagner du temps, mais également pour réduire les risques d’erreurs).

Le second défi est associé aux données elles-mêmes, qui ne sont pas parfaites. L’exemple classique est celui des adresses, qui ne sont pas toujours saisies de la même façon (pour toutes sortes de bonnes ou de moins bonnes raisons). On se retrouve avec des coordonnées qui peuvent parfois être utilisées telles qu’elles, alors que d’autres doivent être corrigées (pour isoler le code postal de l’adresse civique, par exemple). La difficulté du projet est de faire en sorte qu’on puisse corriger les données dans la nouvelle plateforme, sans « perdre » les corrections lors de futures synchronisations (en sachant qu’évidemment, la solution idéale serait de corriger les données à la source).

Enfin, le troisième grand défi relève du volume de données. Le nombre d’enregistrements généré par les données concernant les clients et leurs achats de billets et d’abonnement dépasse la capacité du plus grand forfait Airtable!

Les travaux du conseiller le CPN, en appui à l’équipe du Trident, ont permis d’arriver à une base de données Airtable, couplée à une procédure de synchronisation de données depuis la plateforme de billetterie. Cette base répond aux besoins qui avaient été identifiés, et la procédure de synchronisation apporte des solutions aux défis décrits ci-dessus, et à plusieurs autres enjeux techniques (si vous avez déjà fait circuler des fichiers CSV depuis applications patrimoniales qui ont été bâties pour être compatibles avec Excel 97, vers des applications modernes qui respectent vraiment le standard CSV, vous avez une idée de ce dont on parle…)

Le résultat

Après l’intervention de la CPN, le résultat est une base de données Airtable qui contient l’ensemble des clients du Trident, et de leurs achats.

Cela permet de générer des listes et des statistiques de façon très simple, avec les outils d’Airtable.

Statistiques sur les acheteurs de billets. Un champ calculé détermine le nombre de billets achetés par un client. La fonction de gestion des champs dans une « vue » permet de limiter l’affichage aux colonnes pertinentes. La fonction de filtre permet de se concentrer sur certains enregistrements. Enfin, la fonction de tri permet de présenter les données en ordre décroissant de nombre de billets.

Une autre vue est optimisée pour générer des listes d’adresses courriel. L’outil de tri permet de sélectionner les clients à inclure dans la liste. Ici, on souhaite rejoindre tous les clients qui ont acheté plus de deux billets, et dont on a l’adresse courriel. La liste peut être « copiée-collée » ailleurs, ou exportée au format CSV.

Le résultat des travaux de la communauté de pratique inclut également un document de référence qui explique l’architecture des données, et la procédure de nettoyage et de synchronisation. La solution s’appuie sur un processus qui implique des étapes manuelles et des étapes automatisées :

Il s’agit d’un processus ETL très simple. Les données sont extraites de la plateforme de billetterie au format CSV. La conversion (simple correction à l’encodage) est effectuée dans Google Sheets. Enfin, les données sont chargées dans Airtable grâce au bloc d’import CSV, où des formules font la majorité des corrections et standardisation.

Apprentissages et autres notes

Évidemment, la démarche a permis de faire des apprentissages et des constats qu’il pourrait être utile de partager.

L’enjeu de la qualité des données, et ses impacts, sont évidemment incontournables. Dans le cadre du présent projet, notons que les données exportées de la plateforme de billetterie s’appuyaient sur des identifiants uniques de clients, utilisés à la fois pour les données de clientèle et des ventes. Cet identifiant agissant comme clé de jointure, il a été possible de reconstituer en bonne partie une structure de données cohérente.

Un autre apprentissage réside dans la façon d’utiliser le bloc d’importation CSV d’Airtable. Plus spécifiquement, la bonne utilisation de son option d’ajout en absolu ou de façon incrémentale a été essentielle (pour des données de clients, on veut ajouter seulement les nouveaux, et mettre à jour ceux qui étaient déjà présents dans la base; pour les données de ventes, on veut toujours tout compiler).

Enfin, le défi du volume de données est toujours d’actualité. L’équipe du Trident est en contact avec Airtable pour savoir s’il est possible d’obtenir des forfaits permettant de traiter un plus grand volume.

Comment en savoir plus?

Si vous voulez en savoir plus sur la solution Airtable, nous vous invitons à visionner l’enregistrement de la conférence en ligne offerte par la CPN sur le sujet.

De plus, nous publierons des suites aux articles de la présente série si de nouvelles informations s’ajoutent. Assurez-vous d’être abonnés à l’infolettre de la CPN ou membre du groupe Facebook pour être recevoir l’information.

De plus, n’hésitez pas à prendre rendez-vous à la Clinique de la CPN si vous souhaitez discuter du sujet avec nous!

Crédits

Les icônes utilisées dans les schémas sont tirées de The Noun Project : Software de Adrien Coquet, CSV de StoneHub, spreadsheet de Erickson Duverge et database de Vectors Point.

Les saisies d’écran illustrent la base Airtable du Théâtre du Trident et sont reproduites (avec des données anonymisées) avec autorisation.


La communauté de pratique regroupait des membres de CCNCA autour de projets numériques favorisant le développement des compétences dans les domaines de la découvrabilité et la commercialisation des œuvres, dans l’objectif de répondre à ces enjeux.  Articulée autour d’activités d’apprentissage, de cliniques et de laboratoire, la communauté a permis à ses membres de mutualiser les expérimentations, les apprentissages et leurs coûts. La communauté à conclus ses activités au début de l’année 2023. Cet article constitue une archive.

Vous pourriez vous intéresser à ceci :