Pour démarrer gentiment, explorons les 10 étapes pour élaborer une infographie du tonnerre [en] par Josh Smith, membre de l’éminent studio de design new-yorkais Hyperakt (dont on vous a récemment parlé). Ces dix étapes ont été mises en pratique au sein de cette agence grâce à l’expérience acquise dans le temps. Au vu de notre propre activité plus modeste de producteurs d’infographies (comme ici, ici ou encore ici), il nous semble que cette chronologie soit particulièrement appropriée pour tout projet “data” – infographie ou autre. Les 10 étapes pour faire un projet data selon Hyperakt : 1) récolter les données 2) tout lire 3) trouver le petit truc narratif 4) identifier les problèmes 5) créer une hiérarchie 6) faire une maquette 7) choisir un format 8) déterminer une approche visuelle 9) peaufinage et tests 10) publication. Le plus intéressant se trouve naturellement dans la démonstration cachée entre les titres.
Et pour mettre immédiatement en application cette méthode, nous avons repéré cette semaine trois infographies au style fort différent, mais qui nous semblent toutes particulièrement réussies.
La première, pondue par les maîtres en la matière : le New York Times, qui dépeint en une seule fresque les Résidents invisibles [en] décrits par le projet Microbiome Humain de l’Institut de la santé étasunien. Le défi était pour le moins colossal, puisqu’il s’agissait ici de représenter en une seule infographie un panorama général des microbes classés par familles, par localisation dans le corps, par quantité et par fréquence. Au final, le choix d’enfermer l’arbre de catégorisation naturel dans un cercle permet une représentation claire que n’aurait pas forcément permis un autre modèle géométrique. Ça n’a pas forcément l’air comme ça, mais le boulot de designer informationnel (so chic) c’est quand même un boulot compliqué.
Deuxième infographie, imaginée par l’équipe très efficace de l’Open Data Blog d’il Sole 24 ore : les investissements des fonds souverains, une affaire de 81 milliards [it] qui s’accroche à la gageure de mettre en peinture ce mécanisme de circulation du gros argent entre les pays qui disposent des réserves et les sociétés ou pays qui ont besoin de liquidités. Là encore, la scénarisation de l’infographie est plus ardue qu’elle n’en a l’air, car elle doit être légère en restant fidèle à la complexité des données, et elle doit être… jolie. Et de ce côté, c’est donc plutôt réussi.
La troisième infographie sélectionnée cette semaine est Game of Phones [en], une illustration chatoyante de la guerre sans merci que se livrent Apple et Google à travers leur plate-forme de téléchargement mobile. Le scénario, imaginé par la boîte d’analyse de données App Annie, consiste à poser des chiffres sur une cartographie imaginaire : il est assez courant. L’idée ici est naturellement de livrer un clin d’oeil médiéval à la série TV du moment en dessinant les contours d’un continent improbable à l’esthétique très ludique.
La visualisation de données n’est pas en manque de littérature non plus cette semaine. La lecture du papier en trois parties de Ben Jones, Data Visualisation : clarté ou esthétique ? [en] pose les bases d’une réflexion centrale du journaliste de données lorsque vient le moment de déterminer la meilleure façon de représenter une série de chiffres. L’auteur offre une grille de raisonnement qui prend en considération les atouts et les travers de la représentation lorsqu’elle privilégie un aspect plutôt qu’un autre (clarté ou esthétique, donc). Et synthétise des pistes pour marier au mieux ces axes en prenant en compte un troisième non moins important : l’impact causé par la visualisation.
Partant de cet enrichissement, on apprécie d’autant mieux lorsque le travail du journaliste de données est fortement documenté au point de dévoiler le cheminement in extenso qui a conduit une simple idée de représentation dynamique de la donnée à sa matérialisation finale sur le site (là encore) du New York Times. La dataviz en question date du 17 mai dernier et illustre l’introduction en bourse de Facebook en démontrant comment s’est déroulée celle de 2 400 autres sociétés “techno” et comment leur valeur boursière a évolué après trois ans. Sans surprise avec le NYT, c’est propre, clair, sans fioritures. Et il est donc particulièrement passionnant de se précipiter sur le blog de Kevin Quealy parce qu’il y conserve la trace de toutes les étapes de création de la visualisation pensée par la journaliste Amanda Cox et de sa petite équipe – et le processus créatif pour représenter des données assez complexes est d’autant plus intéressant à comprendre qu’on saisit bien la force des éléments coercitifs mentionnés plus haut : en gros ça doit être beau, mais ça doit être clair, mais ça doit être percutant.
Deux visualisations de données élaborées autour de Twitter ont tenté, elles aussi, d’adopter les bons principes de la semaine – en ne réussissant pas nécessairement à convaincre sur tous les fronts.
La première performance a été réalisée par Jeff Johnston. Son défi : représenter graphiquement les liens [en] qui unissent via Twitter les participants du festival Eyeo et mettre en couleurs l’évolution de ces relations à la suite de la manifestation. À défaut d’être très clair, au moins c’est joli.
Deuxième bel ouvrage, pondu par Nicolas Belmonte, est celui matérialisé à l’occasion de la fin de l’Euro de football : le “streamgraph” #Euro2012 montre “simplement” le nombre de tweets échangés durant la compétition en introduisant le paramètre lexical dans son analyse. Le plus intéressant ici est bien sûr que le dispositif capte quelle équipe est mentionnée pour chaque match et à quel moment du match ces mentions se produisent. À défaut d’être très joli, au moins c’est clair.
Nous terminerons cette semaine 37 avec une présentation (meow) très complète et une réflexion non moins passionnante sur le(s) métier(s) du journalisme de données : les huit chapeaux de la visualisation de données [en]. Plus qu’un simple agrégat d’idées sur la meilleure manière de représenter la data, nous avons là un alignement convaincant d’arguments militant en faveur de la constitution d’un journalisme de données d’équipe tel que nous le pratiquons chez Owni, préférant la somme de talents hors-norme plutôt que la structuration indivise de combattants compétents en tous points mais spécialistes d’aucun. À ajouter, donc, à toutes ces lectures estivales qui réchaufferont les cœurs et les esprits.
Une data viz en Une du Monde lemonde.fr/journalelectro…
— Eric Scherer (@EricScherer) Juin 11, 2012
Puisqu’on vous dit que vous êtes au bon endroit ! La “data” est partout, elle est même en “une” du Monde papier (bon, elle est un peu biaisée, mais l’idée est là) et ça ne va pas s’arranger. Rien que pour cette semaine, on vous parle vite fait de trois actualités Owni avant de passer à la veille proprement-dite.
Primo, votre chronique hebdomadaire des Data en forme (35e épisode sous vos yeux) est désormais en “vedette” du Parisien (papier + web) le week-end. Alors oui, c’est un condensé, un extrait, un florilège, et ça vient quelques jours après la parution originelle de la veille des journalistes de données d’Owni. Mais on ne boude pas notre plaisir qu’un sujet a priori calibré pour les geeks et autres énergumènes à la marge figurent dans un canard aussi populaire, aussi grand public, aussi “mainstream” (brrrr) que Le Parisien. On va faire les Gramsci de bazar, là, mais la culture à portée de tous, etc.
Secundo, Owni soutient à 200% depuis hier et pour toute cette semaine une remarquable opération de journalisme participatif, ou média citoyen selon les goûts, bref de crowdsourcing : l’Opération Sodas des amis d’Open Food Facts (OFF).
Le principe de cet #opensoda d’OFF est très simple : libérer les informations nutritionnelles contenues dans ce que nous consommons chaque jour. Aujourd’hui, la transparence de ces informations est loin d’être acquise, notamment à cause des gentils lobbys qui s’occupent de pouponner notre santé. Avec Owni et TerraEco, OFF va changer la donne, en rendant parfaitement transparentes ces informations écrites en tout petit sur les emballages de notre quotidien, et cette opération à destination du bien-être général sera principalement propulsée par ses heureux bénéficiaires : les citoyens eux-mêmes.
Commençons donc avec les boissons gazeuses sucrées qui jalonnent notre petit parcours de consommateur : caramel et aspartame cancérigènes ? Sucres responsable de l’obésité ? Bulles qui piquent le ventre à en dévorer un steak ? À nous de jouer !
Tertio, Marie Coussin sera sur la scène ce mardi soir d’un Data Tuesday spécial #dataviz – dans le cadre de la manifestation Expoviz que nous vous avons déjà relatée. Marie y présentera le Véritomètre, plate-forme Open Data de vérification de la parole politique (“fact checking“) qu’Owni a réalisée avec i>TELE durant la présidentielle et qui a largement occupé les jours et les nuits de Paule d’Atha.
Restons sur cette merveilleuse (et ancestrale) technique de visualisation de l’information. Dans notre sélection de la semaine – puisqu’il faut faire un choix – nous vous suggérons de vous pencher sur quatre projets très réussis.
Le premier est l’oeuvre de Power2Switch, une start-up de Chicago qui propose un outil de comparaison des différentes compagnies d’électricité et offre la possibilité au consommateur final de comprendre enfin ce qu’il paie grâce à un modèle de facture parfaitement original et inédit.
Le but : pas uniquement de faire joli, mais de parvenir à responsabiliser (et à faire économiser) le client en lui donnant une bien meilleure visibilité sur l’énergie qu’il consomme.
Le deuxième projet est l’oeuvre de Hyperakt pour la Fondation Thomson Reuters à l’occasion du G20. Après avoir pondu une série d’infographie l’an dernier afin de visualiser les cinq pays les plus dangereux de la planète, ce studio de design new-yorkais indépendant a remis le couvert avec les mêmes commanditaires pour mettre en lumière le “top 20 des meilleurs et des pires pays du G20 pour les femmes”.
Comme on peut s’y attendre, la France ne présente pas un visage époustoufflant – notamment sur les questions de représentation de la femme dans les instances et corps dirigeants du pays – mais en décrochant une 5e place derrière le Canada, l’Allemagne, le Royaume-Uni et l’Australie, elle est en plus agréable posture… que l’hôte du G20 cette année, le Mexique, 15e du classement avec ses 300 femmes assassinées à Juarez l’an passé en toute impunité ou ses 25% de femmes abusées sexuellement par leur partenaire.
Le troisième travail choisi est une infographie (en anglais, encore une fois) déjà passée dans notre viseur mais qui circule de nouveau, démontrant qu’en matière de médias nous n’avons que “l’illusion du choix”. Où l’on y visualise, par exemple, que 90% des médias US étaient détenus en 1983 par 50 entreprises différentes, alors qu’aujourd’hui le contrôle est détenu par six mastodontes – dont le chiffre d’affaires annuel dépasse allègrement le PIB de la Finlande. Six géants qui gèrent aussi 70% de ce qui passe à la télé.
Où l’on y voit que la fusion de Comcast et NBC leur assure le contrôle de 20% des heures disponibles et le monopole de 11 marchés entiers dont New York et Chicago ; que 178 millions de personnes s’informent chaque mois avec des journaux appartenant à Time Warner ; que News Corp détient les plus gros journaux sur trois continents et ont “évité” de payer 875 millions de dollars en 2010 – ou encore que Clear Channel possède 1 200 stations de radio tandis que la loi lui interdit d’en posséder plus de 40, et que dans le Dakota du Nord elle possède même localement l’intégralité du réseau. Bref, une infographie qui est jolie et qui informe, et qui fait donc son boulot.
Dernière idée partagée cette semaine en matière de visualisation statique, celle du CV infographique. Le concept est au coeur d’une cogitation et d’une ferveur (ou inversement) depuis pas mal de temps, notamment avec une plate-forme comme Visualize.me. Ce précurseur se connecte à votre compte Linkedin pour vous pondre une représentation “épurée” (voire zen, hein) de votre parcours professionnel sous la forme d’une frise chronologique qui aurait avalé un mobile de Calder.
Dans le genre plus abouti – et surtout plus participatif – il existe donc, désormais CVgram. Alors attention : les goûts, les couleurs. Autant pondre un curriculum vitae ultrastylé pour en balancer plein les mirettes de son futur employeur, qui appréciera votre côté 2.0 (voire 3.0), pourrait être une merveilleuse idée, autant CVgram est également l’outil parfait pour réaliser un CV vraiment très très moche.
Tout est une question de finesse et de calibrage. Car – on le remet ici – une infographie qui fait son boulot est une infographie qui est jolie et qui informe. A bon entendeur, n’hésitez pas à vous inspirer chez les collectionneurs de CV infographiques, ce sont eux les spécialistes du bon goût (#oupas).
Paule d’Atha est parfois sollicitée par des étudiants au cours de la rédaction de leur mémoire portant sur le journalisme de données. S’il est une question qui revient, souvent, c’est celle de la “nouveauté” du métier de data-journalist et précisément de la représentation “graphique” de l’information. Et la réponse, la même, inexorablement : bien sûr que non. Nous ne faisons qu’offrir un courant d’air frais et une régénérescence à une pratique qui existe depuis des lustres.
Pour preuve, ces cartes de la seconde moitié des années 30, qui démontrent comment, à cette époque, déjà, des firmes immobilières établissaient une cartographie discriminante (“redlining maps”) et comment cette pratique pourrait expliquer en grande partie la ségrégation résidentielle des grandes villes – ici aux États-Unis, à Philadelphie – mais l’idée est évidemment valable dans toutes les métropoles du monde.
Ciblée sur cette époque particulièrement critique, ce travail de cartographie discriminante déroule le spectre d’un racisme institutionnalisé : des zones à “prédomination” “italiennes”, “de couleur”, “juives” et des classes sociales (classées de “décadentes”, soit plus bas que les plus bas, jusqu’aux “classes les plus hautes”). Et la finalité, unique : cerner les quartiers “indésirables” afin de diriger les populations vers des bassins d’habitation qui “conviennent” à leur “groupe”.
Un bon gros pétage en règle du concept moderne de mixité sociale, poussé à l’extrême par ces Etats-Unis ségrégationnistes d’avant-guerre, puisqu’on découvre à travers ces cartes discriminantes qu’elles étaient accompagnées d’une autre “merveilleuse” pratique pleine d’humanité : note ton voisinage. Des “travailleurs” à “prédominance italienne” avec une “infiltration” de “nègres” : classe D. Les bailleurs et propriétaires s’y retrouveront pour éviter que les “nègres” en question puissent acheter leur maison, ou alors ailleurs.
Une fois n’est pas coutume – et pour sauter du coq à l’âne – il nous est impossible de passer sous silence deux visualisations de données ayant trait au sport. Parce qu’elles le valent bien.
La première application est une version nettement améliorée (mais sans doute avec des moyens financiers très différents) de ce qu’Owni avait réalisé l’an dernier avec Eurosport autour du mercato de football. Cette année, une idée très semblable accompagne l’Euro2012 de l’UEFA : traquer le bruit généré sur Twitter par l’ensemble des joueurs participants à la compétition, une idée développée par la société Intactile Design avec l’aide de la technologie de Syllabs, une start-up française spécialisée dans l’analyse sémantique sur le web.
Aspect “social” couplé avec une grosse boîte à data (Opta, leader sur le marché), donne un résultat final (pour qui aime le foot, s’entend) qui s’appelle Stats n’Tweets et qui est plutôt convaincant : au moins l’application est-elle divertissante, ce qui est sans doute son objectif principal.
La seconde application cause basket US (NBA) mais elle joue, pour sa part, plutôt dans la Ligue des Champions de la data. Le méfait a été commis – pour changer – par trois journalistes de données du New York Times et l’analyse réalisée par un professeur… de géographie.
Le concept : démontrer grâce à un traitement de cartographie calorimétrique dans quelle zones du terrain les équipes finalistes de la NBA et leurs joueurs vedettes sont les plus dangeureux. C’est propre, c’est intelligent, c’est abordable aux profanes, c’est jQuery + CSS : c’est tout ce qu’on aime.
Nous refermons cette veille hebdomadaire grâce à une vidéo dénichée par Eric Scherer, qui est “une infographie animée japonaise réalisée à partir de données publiques et illustrant l’activité sismique mondiale en 2011”. Le mois de mars au Japon se passe de commentaires.
Cliquer ici pour voir la vidéo.
Excellente data-semaine à tous !
]]>