Penser les donnees : les architectes du big data (Le travail des informations 2/3)

« Data scientists », « Data architects » voire « Data alchemists »

Nombreuses seront les professions qui participent a la conception et a l’analyse des architectures de precisions. Derriere ces intitules se trouvent des individus dont les choix contribuent a faconner la figure des prestations connectes. Prendre en compte la dimension sociale de la fabrique des donnees permet de se apporter les fonds de questionner a Notre fois un forme, ainsi, les usages qui en paraissent realises.

Loin d’etre le reflet neutre et objectif de la realite, les donnees seront le resultat de processus complexes de captation, de cadrage et d’enregistrement d’elements differents sous des formes standardisees et quantifiables. Ces operations impliquent toujours des choix (de variables a prendre en compte, d’echelles sur lesquelles nos quantifier, de seuils, de hierarchisation…) qui conditionnent la forme finale des donnees et, de votre fait, celle des calculs qui pourront etre realises a partir d’elles – ce dont nous parlions dans le premier post de cette serie.

Ainsi, comme l’explique le sociologue Jerome Denis dans le ouvrage la ti?che invisible des donnees, « les donnees ne sont jamais desincarnees et n’existent nullement a l’etat ‘pur’. Elles sont toujours affaire de melanges, de bricolages, d’accommodements, d’agencements hybrides. Elles seront l’objet et le rendu tout d’un boulot ». Les panel impliques avec ce article seront faits – consciemment ou non – par maints acteurs, et en particulier par des specialistes et professionnelles dont le faconnage des donnees constitue le c?ur de metier. Ils et elles concoivent la forme que vont prendre les donnees et les bases dans lesquelles elles sont reunies en fonction des objectifs qui un seront assignes, avant que des petites mains, nombre moins visibles (et dont nous parlons dans le billet suivant de une telle collection) se chargent en construction effective des informations.

Pouvoir des choix de structuration des informations : l’exemple des genres musicaux sur Spotify

Notre maniere dont les informations paraissent construites impacte reellement largement des utilisations qui peuvent en etre faites par les outils (en particulier algorithmiques) qui les traiteront ensuite. Mes objets informationnels que sont des donnees seront des representations schematiques, qui grossissent l’importance des variables et en laissent de nombreuses autres de cote ; ils contribuent ainsi a la structuration de systemes de representation bien precis.

Le processus de categorisation des musiques sur Spotify va permettre d’illustrer votre dynamique. Si l’histoire d’une classification musicale via genre reste bien sur ancienne, et en partie reprise par la plateforme qui n’oublie nullement totalement le « rock » ou le « jazz », celle-ci se targue egalement de faire emerger les « genres musicaux de demain ». L’importance du catalogue musical de Spotify (plus de 50 millions de titres) lui permet Dans les faits de conduire des analyses statistiques sur son fond et coder, sur la base de certains partis-pris, des labellisation inedites.

Le choix de variables particulieres Afin de decrire les titres du fond musical d’la plateforme oriente ces nouvelles categorisations. Celui-ci inclut de facon notable eventuelles caracteristiques liees a des etats emotionnels, egalement appelees « https://besthookupwebsites.org/fr/cougar-life-review/ attributs psychoacoustiques », comme l’energie, la « dancabilite », la « couleur emotionnelle ». Une telle labellisation conduit Spotify a construire un referentiel musical base davantage sur les effets sensoriels supposes des titres que sur leurs caracteristiques structurelles. J’ai plateforme suit en i§a le parti-pris une start-up d’ « intelligence musicale » EchoNest, dont celle-ci a fera l’acquisition en 2014, qui affirmait a l’epoque vouloir developper une categorisation dynamique des musiques en fonction des mots « couramment utilises pour nos decrire », car « chercher du ‘rock’ [serait] tout juste plus efficace que de demander a ecouter des ‘chansons qui sont d’la musique’ ».

Ainsi, Spotify voit aujourd’hui cohabiter 2 types de categorisation musicale, intrinsequement lies aux criteres employes pour nos qualifier : l’un correspond a toutes les genres « traditionnels » de musique et reste base dans leurs caracteristiques structurelles (type de rythme, tempo…), l’autre est oriente par des etats emotionnels ou des activites bien precis supposement lies a leur ecoute. C’est cela apparait sur la capture d’ecran suivante en page « decouverte » de l’interface de Spotify, voyant se melanger d’un cote le hip-hop, le rock et l’electro, et de l’autre la musique « chill », sport ou bien estivale.

Ce glissement par une typologisation emotionnelle en musique pourra etre compris, suivant l’analyse des auteurs et autrices de Spotify Teardown (toute premiere etude de grande ampleur menee sur le fonctionnement de la plateforme), comme s’inscrivant dans « votre mouvement de grande ampleur vers une entree en matii?re utilitariste de la musique, dans laquelle la musique est encore et puis consommee en lien avec votre contexte particulier ou en appui des activites (plutot que dans le cadre d’une experience esthetique ou d’un article de construction identitaire, par exemple) ».

Il semble du reste revelateur de l’importance des choix realises via nos « architectes des donnees » de la plateforme dans la construction une realite qui te prend forme sur son interface. J’ai decision, contraire a toutes les standards classiques de musicologie, d’inclure des variables emotionnelles dans la categorisation musicale, s’accompagne d’une bascule dans la facon dont l’ecoute musicale est envisagee. Si on choisissait certainement deja au temps des cassettes audio d’ecouter des titres differents en fonction de l’instant d’une journee ainsi que ses occupations, la generalisation via Spotify des playlists orientees vers des contextes et des humeurs particulieres (« a ecouter a domicile », « motivation concernant le sport », « matin »…) normalise ces categories, ainsi, oriente de votre fait a grande echelle des confortables d’ecoute des utilisateurs et utilisatrices. J’ai forme Plusieurs informations, pensee par leurs concepteurs et conceptrices, conditionne leurs usages.