vendredi 28 mai 2010

Méfiez-vous de la grande échelle

"Je suis relativement d'accord" ~ Albert Einstein
Aujourd'hui, on va parler d'un concept trop abstrait pour beaucoup de gens apparemment : l'échelle macroscopique.  Le principe étant que si on réfléchit sur des données à portée mondiale, on ne l'applique pas à son propre cas, à sa propre échelle. Il y a très peu de chance que cette approche ne mène à quelque chose, je préfère prévenir. 
Pour information, c'est le meilleur argument des syndicats la plupart du temps. "Ouais, mais vous vous rendez compte, cette entreprise fait plus de 7 milliards de CA et Robert il touche que 1300€ par mois."  Donc là, on oublie entièrement le nombre d'employés dans la boite, les fonctions de Robert, son implication, les investissements de la boite, le pognon donné au comité et autres festivités. Bref, c'est pas un argument. Or, comme dans tout journaliste, il se cache un gauchiste, le plus souvent en peau de zobi (sic), on obtient des résultats drôles dans les médias. 
Dernièrement, j'ai remarqué que pour une fois, plusieurs médias que je consulte régulièrement, que je ne citerais pas (pour ne pas faire de pub à ZDNet, Clubic ou Futura-sciences), ont tous relayé l'information de l'année :
Google sape la productivité mondiale avec Pac-Man
En résumé : un absurde article sorti par un absurde blogueur-entrepreneur a fait des petits calculs (niveau CM2*) et impressionne tout le monde. La base de l'information étant que pour l'anniversaire de Pac-Man, Google a mis sur sa page d'accueil un petit jeu JS pour faire mumuse un logo Google-Pac-Man, bref du fun quoi. Conclusion : les gens ont passé 36 secondes de plus en moyenne.
Petits calculs, on arrive à 5 millions d'heures "gâchées" au niveau mondial. Et les gens commencent à faire un calcul de qu'est-ce qu'on pourrait faire avec ça. On pourrait notamment embaucher pour 6 mois de boulot des 20.000 employés de Google. Par la suite, le gars propose une solution de tracking de productivité des employés de son entreprise (hey faut bien faire du pognon m'sieurs dames). Bon alors, un petit itemize ?
  1. Rien ne prouve que l'ensemble des visites étaient sur les temps de travail de chacun
  2. On aurait pu employer 20.000 employés de Google pendant 6 mois, ouais, je rappelle que les entreprises du monde emploient des milliards de personnes (soit plus de 100.000 fois plus) constamment (soit infiniment plus que 6 mois).
  3. Est-ce que 36 secondes passées sur un truc autre que le boulot impliquent 36 secondes de pertes ? Chez Google, justement, les employés ont le droit de passer 20% de leur temps sur des projets personnels. Les loisirs permettent de bosser correctement je vous le rappelle, donc 36 secondes de perdues = 2min de travaux plus effectifs
  4. Que dire des jeux vidéos et des réseaux sociaux Web2.46 qui sont ultimement plus chronophages que UN pac-man qui n'est accessible qu'UN jour
  5. Je vais vous apprendre un truc aussi (niveau 2nd je sais c'est dur), c'est les chiffres significatifs. ~36s * ~504.703.000 n'est pas égal à 4.819.352h. C'est au pire égal à ~4.8 millions.
  6. Que dire de l'impact économique mondial de Google ? (estimé à 50 milliards par an)
Ce qui m'attriste dans tout ça, c'est pas qu'une entreprise qui veut vendre son produit utilise un argument marketing moche, c'est son boulot, je rappelle. Non, ce qui me choque c'est que tous les journalistes ont reporté cette information (en bref la plupart du temps heureusement). Oh, les gens réveillez-vous. Comme disait Coluche "Les journalistes, non seulement ils écoutent les conneries, mais ils les répètent !"
Conclusion : méfiez-vous des gens qui vous parlent des chiffres qui dépassent les millions.

lundi 17 mai 2010

L'article 1271

"Les chiffres, c'est pas une science exacte, figurez-vous" Karadoc, Kaamelott L.V-3
L'article 1271 fait référence au PhD Comic #1271 qui critique la manière dont les sondages sont utilisés dans la presse. De là s'en suit une série de critiques que l'on peut faire sur la "rigueur dans le traitement de l’information" comme dirait certains (chut chut pas de noms).
Je vais ici reformuler l'article 1271 et ses quatre alinéas.
Article 1271: A pour but d'identifier les erreurs de raisonnement de la presse sur les chiffres et autres sondages.
  1. Aucune conclusion ne peut être tirée de deux chiffres si leur différence est moindre que la marge d'erreur induite par la loi de probabilité sous-jacente
  2. Les faits scientifiques ne sont pas établis par le résultat d'un sondage d'opinion publique
  3. Un sondage effectué sur une cible subjective n'est pas un sondage scientifique.
  4. L'ajout de l'option "Sans opinion" peut impliquer de lourdes conséquences sur un sondage
Voilà l'entière étendue de cet article. Par la suite, les références à celui-ci seront représentées par "1271-3" par exemple pour citer une violation du 3e alinéa de l'article 1271. Bon, détaillons un petit peu alors.
Alinéa 1
C'est un des plus utilisés sur les news d'intérêt général. En clair pour donner un exemple, supposez que l'on annonce que la popularité du président a chuté de 40.257% à 39.578% sur un échantillon de 1502 personnes. Ça ne sert à rien d'aller plus loin.
Pourquoi ça ? Les probas peuvent répondre à ça (pour plus de détails, consultez Marge d'erreur qui cite notamment un cas sur un échec d'un article de Newsweek). Globalement, pour être sûr à 95% du résultat (ce qui reste faible), il faut un écart entre les chiffres supérieurs à 100/√N pour cent (N étant l'échantillon). Dans notre cas, 100/√1502 ≈ 2.6.
Conclusion : en premier point, ça ne sert à rien de mettre les virgules, car même l'unité n'est pas pertinente. Et bien sûr, en deuxième point : on ne peut pas conclure sur cette chute. Cet alinéa peut être utilisé pour ceux qui utilisent des écarts de quelques micro-% sur des chiffres de ventes. C'est assez magistral d'ailleurs la plupart du temps, si vous faites attention. Si vous le couplez au 3e point, les effets sont dévastateurs, car la marge d'erreur due à la subjectivité peut exploser exponentiellement.

Alinéa 2
Ce point affecte certains articles des médias qui pensent résoudre les problèmes en faisant un sondage. Le strip original met en scène Galilée qui doit défendre que la Terre soit ronde face à un journaliste et son sondage. ##Notez que Jorge Cham (l'auteur du strip), s'est bien planté pour un scientifique, car on sait que la Terre est "ronde" depuis l'Antiquité ; Eratostène a même estimé son diamètre. Galilée a eu des soucis, car il défendait la thèse copernicienne (la Terre tourne autour du Soleil et pas l'inverse).##
Bref, laissez aux domaines scientifiques le travail d'établir la vérité sur les faits. Notez que sans sortir d'un contexte tout à fait habituel, on peut trouver des articles qui s'y réfèrent. Par exemple, prenons un article exposant un sondage sur l'impact des décisions d'un de nos personnages politiques. Ce n'est pas à l'opinion publique de décider si untel est efficace ou non, car premièrement ils ne sont pas analystes, et deuxièmement ils ne savent pas tout.

Alinéa 3
Ce point a été élargi un peu par rapport à la version originale. Dans la version originale, la règle vise les médias qui font un sondage sur leurs propres sites web. La version actuelle ne fait que part de la subjectivité flagrante des sondés.
Par exemple, mettez sur le site internet du canard enchaîné un sondage "Pensez-vous qu'il faille reculer la retraite à 65 ans ?". Et par la suite, titrez en toutes lettres "80% des français pensent que l'âge de la retraite ne doit pas être reculé". Là, vous êtes en plein dans le 1271-3. Notez que ça peut très vite arriver, car même si vous faites un sondage internet simple, vous tablez sur votre lectorat, et même si ce site est très grand public et qui essaie d'être objectif, vous n'aurez pas de représentation fidèle de la population. De plus, la plupart du temps, ces sondages sont de piètre qualité et sont là pour "Remplir l'espace". 
Enfin, on peut rentrer dans cette catégorie, avec précaution, l'ensemble des analyses de parts de marchés basées sur des statistiques récoltées par des organismes qui ont accès à certaines données. Par exemple, les parts de marchés des navigateurs sont calculées par des sociétés qui offrent leurs services d'analyse de visites pour les webmestres. L'agrégation de ces sites donne une grande banque de données pour analyser les tendances des parts de marchés. Le problème c'est qu'aucun n'arrive à avoir un échantillon représentatif. Selon l'un, les parts de Firefox sont de 60% alors que pour l'autre, elles seront de 53%. Les différences sont majeures, c'est pour cela qu'une analyse se basant sur une seule et unique source n'est pas crédible.

Alinéa 4
L'option sans opinion est majeure dans certains cas et peut changer très clairement la donne. Je n'aurai pas de détails à apporter de supplémentaires, car il suffit de regarder les suffrages français pour s'en convaincre. Que ce soit le vote présidentiel ou le référendum de la Constitution Européenne. Je suis persuadé que si l'on avait laissé l'opportunité de voter "Je m'en fous" à ce référendum, les politiques n'auraient pas eu un "Non" ou un "Oui" comme réponse.
Dernièrement, un sondage BuisnessMobile demandait si la politique de validation des applications par Apple était a) Exagérée b) Inacceptable c) Légitime. Déjà, la différence entre a) et b) est difficile, de plus, il n'y a pas la quatrième option : sans opinion. En plus, ce sondage devrait être posé seulement à ceux que ça concerne : les développeurs. Bref, il y a de quoi bien se marrer.
Voilà qui conclut la présentation de l'article 1271. On aura l'occasion d'en reparler, croyez-moi.

mardi 11 mai 2010

Le classique ZDNet-Marketing


Quand les journalistes d'HiTech font de l'analyse sur les produits technologiques, déjà on se marre bien. Mais quand on est sur de l'analyse du so-called "e-Marketing" alors là, on est sur du comique.
Alors là pour le coup, paf, la rédaction vous propose aujourd'hui... je vous le donne Émile : un rapport de cabinet d'analyste sur la publicité de l'IT. Pour ceux qui me connaissent, j'ai en général du mal avec les analystes et sur leurs prétendues prédictions des "Next Trends". La notoriété qu'ont ces gens dans l'IT m'impressionnera toujours, mais s'il faut ça pour faire mumuse avec les cours boursiers du Nasdaq, mettons. Par contre, leur travail est aussi de faire des statistiques et autres rapports sur les différentes entreprises. Jusque-là tout va bien !
Le cabinet analyse 7 piliers de l'IT mondial : Amazon, AOL, Apple, eBay, Google, Microsoft  et Yahoo. Ouais on commence à être sur du lourd là. Et là, le journaliste extrait ce fameux :
Le constat le plus frappant est qu'Apple a consacré un budget de 249 millions de dollars (0,5% de son chiffre d'affaires) contre 518 millions de dollars pour Microsoft (0,9% de son CA). Or, dans les faits, c'est la marque à la pomme qui a la meilleure visibilité. Ses publicités semblent plus présentes et marquent plus les esprits que celles de Microsoft.
Ça c'est de l'humour, m'sieurs dames ! Je remarque que le journaliste a pensé à citer le pourcentage du CA, ce qui est bien déjà (pour rappel, c'est la seule donnée qui représente quelque chose pour comparer les deux investissements). Mais la suite est tout bonnement magistrale. Là, on est en train de démonter à coup de truelle un rapport indiquant des pourcentages d'investissements en disant "Ouais, mais on est plus marqué par les pubs Apple que Crosoft hein...". On arrive sur du gros niveau. Chaud devant, voici le premier des nombreux itemize de ce blog :
  1. "Ses publicités semblent plus présentes" : arrête tout de suite, t'es pas crédible. 
  2. Quand on veut, pour des raisons X ou Y, comparer deux investissements en pub, on regarde les résultats en se basant sur un panel de personnes (mettons 1000 au hasard), et pas sur son avis perso, ou au pire, de la rédaction de ZDNet et de ses copains.
  3. Oh, au fait, les CA de Crosoft et d'Apple sont peut-être similaires, mais leurs rentabilités ne sont pas DU TOUT les mêmes. Le revenu net de Crosoft est aux alentours des 15 milliards, et le revenu net d'Apple est de 8 milliards. Donc potentiellement, Crosoft est presque deux fois plus rentable, même en balançant 0.9% de son CA en publicité. Conclusion : je ne vois pas en quoi c'est un PHAIL de Microsoft.
  4. Vous n'avez jamais vu un "Internet Explorer 8 vous protège ?" en gros, voire très gros, sur des sites ultra-visité. J'aimerai pas voir la facture de tout ça. Avant de comparer les pubs, enlevez votre AdBlock. (Fait marquant sur ZDNet.fr, je désactive mon AdBlock et je tombe sur une pub IE, juré...)
  5. Pourquoi Apple ferait plus de pub ? Ils ont une arme absolue : c'est la communauté. La notoriété d'Apple fonctionne là dessus et c'est pour ça qu'on se rappelle de tout ça. De plus, vous leur en faites gratos en parlant en avant-première de l'iPad et des prédictions complètement fantasmolgoresque des analystes sur les nouveautés de l'iPhone 5.23 en 2018.
Autre point encore plus drôle à mon sens : le journaliste est surpris de voir ceci :
Yahoo avec ses 45 millions de dollars investis (0,7% du CA) dépasse largement Google qui n'a déboursé que 11 millions de dollars (0,05% du CA).
Je sais que ça peut en traumatiser certains, mais Google a deux avantages.
  1. Il a les parts de marché mondiales sur les moteurs de recherches. 9 internaute sur 10 en ce monde vont passer par www.google.com dès qu'ils vont se brancher on-da-web. Cette entreprise n'a pas besoin de dorer son image de marque, elle est déjà faite.
  2. C'est le plus grand publicitaire mondial sur Internet... c'est tout... pourquoi investir dans la pub ?