| Radin, Dean |
Retour à la première partie de l'article.
Quatrième Partie Dans le troisième (« La reproductibilité ») et quatrième (« La méta-analyse ») chapitre, Radin compare la performance des joueurs de baseball avec celles des médiums (Gary Schwartz aime aussi les comparaisons sportives, même s'il préfère pour sa part comparer les performances des médiums à celles des joueurs de basketball). L'analogie sportive est trompeuse, parce que si nous savons ce que cela signifie pour un joueur de baseball de réussir .357 ou pour un joueur de basketball de réussir 50% de ses paniers libres, à l'inverse nous ne savons pas ce que cela signifie pour un sujet, un groupe, ou un ensemble de groupes de « réussir » 34% quand il s'agit de deviner des cartes alors que le hasard se situe à 25%. Même si le hasard ou la chance joue un rôle dans le baseball et le basketball, l'analogie entre les sports et le hasard mathématique n'est pas aussi évidente que Radin le prétend. Les chances de deviner une série de cartes à jouer sont claires et il est possible de les calculer, et elles n'ont rien à voir avec les performances passées d'un individu donné à deviner des cartes. Les chances qu'un joueur de baseball frappe la balle ou qu'un joueur de basketball fasse un panier ne peuvent être calculées que si on connait les statistiques liées à un individu particulier. Radin utilise l'analogie du baseball pour introduire certains concepts statistiques importants, comme par exemple un « intervalle de confiance à 95% ». Il remarque ce qui est évident: la moyenne des succès du joueur de baseball Mickey Mantle durant toute sa vie est une meilleure mesure de sa « compétence réelle » qu'une seule année durant laquelle il n'a eu que quelques rares succès ou une année durant laquelle sa performance a varié de manière importante. Radin pense qu'il est pertinent de comparer cette procédure consistant à mesurer la « compétence réelle » de Mantle à celle qui consiste à prendre les données de différentes études sur le Psi et les agréger ensemble dans le cadre d'une méta-analyse. L'implication est que les méta-analyses sont une meilleure mesure de la « véritable valeur » de ces études prises individuellement. En réalité, les méta-analyses vous donnent des échantillons plus importants, ce qui en retour vous permet de calculer une statistique pour l'intervalle de confiance à 95% que vous n'avez pas nécessairement dans chacune des études individuelles. Il aurait put tout aussi bien comparer la moyenne de 17 joueurs durant 17 ans et prétendre que la moyenne totale vous donne la « véritable valeur » du « joueur moyen », ce qui serait une baliverne. A cause de l'analogie du baseball, le lecteur reste avec l'impression que, dans les expériences sur le Psi, on va comparer les performances du hasard mathématique avec les performances effectives des individus et des groupes d'individus. Cependant, Radin ne mentionne pas que la différence entre le hasard et la performance actuelle de la divination de cartes ne présente d'intérêt, par exemple, que si on présuppose que ce qui est attendu par le hasard théorique est ce qui se produit effectivement dans le monde réel, ce qui est un présupposé qu'il est tout à fait possible de questionner (voir mon entrée sur l'« Hypothèse concernant le Psi »). Nous pouvons cependant accepter en partie son analogie: les performances Psi varient, de même que les performances des athlètes. Cependant, comme nous n'avons aucune idée de comment le Psi fonctionne, nous n'avons aucune idée de comment le Psi varie. Si nous présupposons que le Psi est une compétence humaine comme frapper une balle au baseball, alors certaines personnes seront meilleures que d'autres et la pratique améliorera la compétence jusqu'à un certain point. Si, à l'inverse, le Psi est un événement spontané plutôt qu'une compétence, on peut alors dire adieu à toute possibilité de réaliser des expériences contrôlées réplicables. Radin admet que les expériences Psi fonctionnent avec le présupposé - qui est selon moi un présupposé faux - que si un sujet devine correctement « alors, c'est considéré comme une preuve de deux choses: les perception extra-sensorielles (PES) ou la chance » (p. 37) (Selon lui, on ne peut dire quand un frappeur cogne la balle par adresse ou grâce à un coup de bol. En voyant la balle s'envoler hors du stade, la plupart des amateurs évoqueront le premier facteur. Bien entendu, la chance intervient quand la balle fonce directement dans le gant de l’arrêt-court ou tombe exactement entre les joueurs du champ centre et du champ gauche, mais ce type de chance est bien différent de celui dont on parle quand il s'agit d'expériences avec des cartes). La question de la reproductibilité est suffisamment compliquée sans amener toute ces analyses superflues consacrées au baseball. En résumé, Radin nomme Psi un résultat dont il est peu probable qu'il soit dû uniquement au hasard (c'est-à-dire à la simple chance) mais il reconnait qu'un seul essai ou qu'une seule étude ne seront pas suffisants pour établir l'existence du Psi. La reproductibilité des résultats est nécessaire. Il y a des remarques intéressantes que fait Radin à propos de la reproductibilité. La plupart des réplications échouent. La plupart des études réussies ne sont pas répétées. Les réplications ne sont pas récompensées, alors que les recherches originales le sont. Cependant, nous dit-il, les enquêteurs du Psi ont « réalisé des milliers de réplications d'études » (p. 39). Radin passe la grande partie du chapitre trois à discuter de huit raisons pour lesquelles les réplications sont difficiles à réaliser. La première est que les phénomènes Psi ne seraient pas reproductibles parce qu'il n'y aurait rien à répliquer. Certains sceptiques font cette assertion, dit-il (p. 41). Il n'est bien entendu pas d'accord. Les expériences avec des gens sont difficiles à répéter parce que les interactions entre l'expérimentateur et les sujets affectent les résultats. Il y différents facteurs psychologiques qui ont été pris en considération quand il s'agit d'évaluer les études portant sur les êtres humains, et ceci inclut les attentes de l'expérimentateur et de leurs critiques. Les chercheurs Psi peuvent ne pas remarquer des données qui se trouvent juste sous leurs yeux, et de même les sceptiques. Les gens ne sont pas statiques, et les résultats des mêmes tests sur les mêmes gens peuvent souvent donner des résultats différents à cause de changement dans les gens eux-mêmes. Le biais de confirmation peut affecter comment les expériences sont conçues, conduites et interprétées. Mais la parapsychologie souffre d'un autre problème, nous dit Radin: un biais dans les médias, y compris les médias scientifiques. Il prétend que Newsweek (1995) a créé une « pure fiction » quand le magazine a déclaré que « d'autres labos, utilisant la machine de [Robert] Jahn [pour des expériences de psychokinèse], n'ont pas obtenu les mêmes résultats » (p. 43). Ceci n'est pas une fiction, pure ou impure. Stanley Jeffers, un physicien à l'Université de York, Ontario, a répété les expériences de Jahn mais avec des résultats au niveau du hasard (Alcock 2003, p. 135-152) (voir "Physics and Claims for Anomalous Effects Related to Consciousness" dans Alcock & co. 2003. Résumé.). Il a utilisé l'équipement de Jahn ainsi que le sien, et aucun des deux n'a réussi à répéter les résultats (Jahn & co. ont aussi échoué à répliquer les résultats de PEAR lors d'expériences réalisées en Allemagne (voir « Mind/Machine Interaction Consortium: PortREG Replication Experiments », Journal of Scientific Exploration, Vol. 14, No. 4, pp. 499-555, 2000. Ce travail ayant été réalisé avant la publication de « La Conscience Invisible », nous ne pouvons pas reprocher à Radin de ne pas avoir mentionné cet échec de réplication. Cependant, nous pouvons le lui reprocher pour son livre de 2006, « Entangled Minds »). Jeffers lui-même remarque le biais dans les médias scientifiques lorsqu'il écrit: un éditeur a offert en riant de publier un papier PEAR « seulement si celui-ci lui était transmit par télépathie ».* Radin prétend que « les recherches de Jahn ont été répétées par plus de soixante-dix chercheurs dans le monde, aussi bien avant qu'après que Jahn ait produit le corps principal de son travail » (p. 43). Comment est-ce que quelqu'un reproduit quelque chose avant que le travail principal n'ait été réalisé? Certains pourraient considérer le travail de Jahn comme une répétition des essais d'Helmut Schmidt avec des générateur de nombres aléatoires (GNA), mais cela semble absurde de considérer que le travail de Schmidt est une réplication du travail de Jahn. Et pourtant, c'est ce que Radin fait (puisque Radin considère que les méta-analyses sont identiques à des réplications, cette notion de réplications réalisées dans le passé lui semble raisonnable, je suppose). Sur un autre sujet, je suis d'accord avec Radin lorsqu'il dit qu'utiliser le terme « pseudo-science » pour décrire les recherches sur le Psi est contre-productif. De telles étiquettes sont des entraves à la discussion. D'un autre côté, je ne pense pas que les parapsychologues devraient s'attendre à être traités comme des physiciens, des biologistes, ou des chimistes juste parce qu'ils ont des intentions scientifiques. Ils doivent faire mieux que juste produire quelques études statistiques intéressantes. Aussi populaire que le livre de Radin soit, proclamer que vous avez la vérité scientifique à propos des phénomènes métapsychiques, et que cela a été répliqué et démontré n'est pas suffisant. Les données doivent parler pour elles-même. Parce qu'il n'y a pas de théorie générale de comment le Psi fonctionne, Radin semble penser que la parapsychologie est orientée par les données plutôt qu'orientée par la théorie, mais rien ne pourrait être plus loin de la vérité. L'a priori qui dirige le travail de tous les chercheurs du Psi est que si les sujets ont réalisé un score meilleur que le hasard, alors ils ont démontré le Psi (pour autant qu'il n'y ai pas de fuites sensorielles, de tricherie, de fraude, d'erreurs statistiques, etc.). Mais la détermination de si les données peuvent être expliquées uniquement par le hasard peut être affectée significativement par des biais, nous dit Radin. Cependant, tous ces exemples sont des chercheurs ou des sceptiques qui interprètent les données comme étant causées par le hasard, et non le Psi. Il n'a pas d'exemple de personne qui interprète les données comme étant causée par le Psi quand le hasard serait une meilleure explication. Par exemple, Radin attribue la différence entre comment John Coover interprète ses données de divination de cartes et la manière dont Robert Thouless les interprète aux attentes de la part des sceptiques. Coover fut le premier « Fellow in Psychical Research » de l'Université de Stanford. Jusqu'en 1917, il réalisa quatre grandes études (avec 10000 essais et plus) et il rapporta qu'il n'avait rien trouvé qui apportait du poids à la croyance dans les perceptions extra-sensorielles (PES). L'expérience principale impliqua 100 paires de sujets dans 100 essais. Grosso modo la moitié de celles-ci furent à propos de la télépathie (expérimentale) et l'autre moitié à propos de la clairvoyance (contrôle). C'est-à-dire que, dans la moitié des essais, un émetteur a regardé la carte avant d'essayer de l'envoyer par communication télépathique à un receveur. Dans la seconde moitié, l'émetteur a regardé la carte après que le receveur ait tenté de la deviner. Radin écrit que la capacité du receveur à deviner la carte correctement fut de 160 contre 1 en défaveur du hasard (1997: 65). En 1939, le psychologue Robert Thouless (d. 1984) a trouvé que si les données de l'expérience principale étaient regroupées ensemble, il y avait 44 succès au-delà de ce qui était attendu par hasard. Thouless suggéra que les données donnaient du crédit à un léger effet paranormal. Il calcula que les probabilités que cela se soit produit par hasard était de 200 contre 1. Coover attribua ce supplément de succès à des erreurs d'encodage de la part des expérimentateurs (Hansel 1989: 26). De plus, F. C. S. Schiller trouva que les données donnaient des probabilités de 50000 contre 1 à l'encontre du hasard, mais il n'utilisa que les quatorze sujets avec les résultats les plus élevés. Coover répondit qu'il lui était possible de trouver toutes sortes d'événements allant à l'encontre du hasard s'il était sélectif dans son utilisation des données (Hansel: 1989: 28). Le prix Nobel Charles Richet fut particulièrement vocal dans sa critique du travail de Coover. Coover répondit en proclamant qu'il ne pouvait pas être nié que la fraude était fréquente, générale et bien connue dans la recherche métapsychique. Le témoignage de phénomènes médiumniques par des hommes astucieux et éminents, dit-il, a eu un effet négatif sur les recherches parce que cela a mené à écarter les interprétations contraires des mêmes phénomènes, ignorer les manques de contrôles durant ces expériences métapsychiques, et à se baser sur les témoignages corroboratifs des autres, à un tel degré que cela a fragilisé la rigueur contre la fraude à laquelle on s'attendrait de la part des chercheurs. Coove remarqua aussi que dans les autres sciences les chercheurs contrôlent les conditions, mais lorsqu'il s'agit de tester les pouvoirs médiumniques, les médiums contrôlent les conditions.* Ni Schiller, ni Richet, ni même Thouless, cependant, ne tentèrent de répéter les expériences de Coover. Pour cela, il faudra attendre que J. B. Rhine s'installe à l'Université de Duke en 1927. Radin dit que Coover était peut-être plus pessimiste à propos de ses données que d'autres à cause de la « pression désapprobatrice de ses pairs à Stanford » (p. 65). Cependant, Radin remarque aussi que diverses études ont montré qu'1% d'erreurs lors de l'encodage est typique. Du coup, la suspicion de Coover pourrait très bien avoir été justifiée. Radin écarte aussi le travail de J. L. Kennedy (1939) et le compare à un croyant - qui n'est pas nommé - qui, sur base de l'analyse des mêmes données, a obtenu une probabilité de 10 millions contre 1 que le résultat se soit produit par hasard alors que Kennedy dit pour sa part que rien d'intéressant n'est ressortit de ses résultats. Radin écarte aussi l'évaluation réalisée par Ray Hyman des données du Ganzfeld comme étant entachée par des attentes (voir « The Elusive Quarry: a Scientific Appraisal of Psychical Research », Prometheus Books, 1989. Voir aussi Hyman, 1995). Radin remarque que 13 répétitions non significatives, lorsqu'elles sont combinées en une seule grande expérience, « produisent un résultat global qui est statistiquement significatif » (p. 46). Au lieu de voir cela comme quelque chose d'embarrassant, Radin prend au contraire cela comme une preuve de l'intérêt des méta-analyses. Qui ne pourrait s'enthousiasmer pour une méthode qui permet de prendre 13 échecs de réplication, les additionner ensemble, et obtenir au final une grande réplication statistiquement significative? Radin attaque aussi Susan Blackmore pour ne pas voir la signification de ses propres recherches. Blackmore, qui a un diplôme en parapsychologie et qui a fait de la recherche dans le domaine pendant des années, l'a finalement quitté parce qu'elle ne pouvait trouver de preuves concluantes de l'existence du Psi. Elle a aussi trouvé qu'un des laboratoires qui obtenait les meilleurs résultats dans le cadre des recherches Ganzfeld n'était pas comme il prétendait l'être.* En ce qui concerne les réplications, Radin remarque qu'il y a des problèmes importants liés à des facteurs statistiques. Il remarque que les probabilités de reproduire « exactement la même expérience » avec 50 sujets est d'à peu près 50% (p. 47). Cela est vrai quelle que soit l'expérience originale. « Les expériences qui impliquent des êtres humains n'arrivent jamais à être exactement les mêmes deux fois... » (p. 47). « Les sceptiques qui demandent des taux élevés de réplication pour les expériences Psi ne comprennent simplement pas les statistiques de la répétabilité » (p. 47). Cependant, quelqu'un qui peut additionner 13 mauvais tests pour en obtenir 1 bon, lui, prétendument comprend ces statistiques? Les défauts dans la conception de l'expérience est un autre facteur qui affecte la répétabilité. Radin remarque correctement que tous les défauts ne sont pas créés égaux. Certains sont fatals, mais d'autres non. Ce n'est pas une critique valide de dire qu'il est possible qu'il existe un défaut inconnu des sceptiques dans une expérience. Aucune expérience n'est parfaite, mais cela n'excuse par les mauvaises conceptions ou le manque de contrôles durant une expérience. Radin a raison de dire qu'il serait « trop d'exiger pour un phénomène impliquant des performances d'êtres humains » qu'il fonctionne à chaque fois. Mais il devrait fonctionner la plupart du temps, non? Est-ce que vous, vous prendriez un médicament qui a fonctionné lors des essais une fois sur six? Exactement, combien de fois est-ce qu'une étude doit être répliquée? Comme la plupart des recherches ne sont pas répliquées - et même le plus souvent personne ne tente de les répliquer - la question semble discutable. Hansel a dit qu'il accepterait le Psi s'il y avait 3 bons essais à 100 contre 1 contre la chance. Radin dit que cela a été fait des douzaines de fois et « les sceptiques informés savent que le hasard n'est plus une explication viable pour les résultats obtenus dans le cadre des expériences Psi » (p. 50). Cependant, pour Radin ces réplications se produisent dans des méta-analyses, le style d'étude qui vous permet de prendre 13 mauvaises recherches et de les transformer en une seule bonne. Comme le dit R. Barker Bausell: les méta-analyses « élèvent le biais de publication au niveau d'une forme d'art ».
Fin de la quatrième partie.
Cinquième Partie
Radin explique dans la quatrième partie comment il comprend et utilise les méta-analyses. La méta-analyse est pour lui la poule aux œufs d'or. Contrairement à R. Baker Bausell, Radin ne voit pas la méta-analyse comme une forme de biais de publication. Bien plutôt, il l'utilise comme une manière de mesurer combien la réplication s'est produite. Je ne connais personne d'autre qui considère que la méta-analyse est une forme de réplication des études scientifiques. La plupart considèrent qu'il s'agit d'une manière de mesurer s'il est probable qu'il y ait quelque chose de significatif en train de se produire dans une relation causale, et ce même si l'effet est très petit. Il appelle la méta-analyse « l'analyse des analyses », mais je ne pense pas qu'en réalité cela implique l'analyse d'une analyse: il s'agit d'une manière d'utiliser des formules statistiques afin d'extraire de la signification statistique à partir d'un échantillon d'études. Radin fait plusieurs analogies discutables dans ce chapitre. Nous en avons déjà mentionné une: il compare la moyenne des frappes des joueurs, des équipes, et des leagues avec les performances psi des individus, groupe et groupes de groupe. L'analogie est fallacieuse parce que, s'il y a peu de désaccord entre la répétabilité et la signification des données en baseball, la fiabilité et le signification des données des expériences psi est pratiquement toujours largement discutable. Nous ne sommes jamais vraiment certain de ce que représente les données d'une expérience sur le psi. Nous savons ce que cela signifie pour un jouer de frapper .357, mais nous ne savons pas ce que cela veut dire pour un sujet, un groupe, ou un groupe de groupes d'obtenir 34% de réponses correctes dans une tâche consistant à deviner des cartes lorsque le hasard prédit 25%. Je reviendrai brièvement à cette seconde analogie discutable. Mais premièrement, cependant, nous allons voir comment il conçoit la recherche scientifique. Radin discute quatre différentes manières de passer en revue la recherche scientifique, mais il n'est pas clair en ce qui concerne la signification de cette distinction, et il n'est pas non plus clair à propos de pourquoi nous en aurions besoin. La seule qui compte est la méta-analyse. Il nous dit qu'il s'agit « d'une technique structurée pour analyser de manière exhaustive un ensemble complet d'expériences » (souligné par moi). Cela induit le lecteur en erreur parce qu'aucune méta-analyse ne peut peut savoir si elle est exhaustive ou complète. La plupart, en fait, impliquent un processus d'élimination de certaines études, aussi que la reconnaissance que celle-ci ne peut pas être complète à cause du fait que la plupart des études ayants obtenu des résultats négatifs n'ont pas été publiées (l'effet tiroir). Il écarte sommairement l'effet tiroir comme n'étant pas important parce qu'il a une formule statistique qui montre que le nombre d'études devrait être incroyablement élevé). Son affirmation trompe aussi le lecteur parce que, comme Radin le remarque lui-même, dans le cadre d'une méta-analyse le lecteur doit évaluer les différentes études sous divers aspects tel que, par exemple, les chercheurs, la nature des contrôles, le nombre de sujets dans l'étude, où l'étude fut publiée (si elle a été publiée), et les similarités ainsi que les qualités globales des études. Radin écarte en une seule phrase les problèmes liés aux biais et simplifications excessives dans la manière de passer en revue les études en se plaignant que « les critiques sont partout » (p. 54), comme si cela était une mauvaise chose! Comme le remarque Ray Hyman dans sa revue des études ganzfeld (Hyman 1989): il (Hyman) et Charles Honorton sont en désaccord en ce qui concerne l'évaluation de la qualité de beaucoup d'études qu'Honorton a inclu dans sa méta-analyse. Nombre de ces désaccords étaient basés sur ce que Hyman considérait comme des techniques de randomisation adéquates. Il critiqua aussi Honorton pour ne pas avoir inclu un certain nombre d'études et pour ne pas avoir remarqué qu'il existe une tendance à ne publier les résultats des études avec un échantillon faible que si les résultats sont positifs. En résumé, Hyman trouva un certain nombre de défauts que Honorton ne percevait pas comme tel (voir Hyman, 1989, p. 42-44). Radin décrit les méta-analyses comme une méthode comparant les pommes et les oranges pour apprendre quelque chose à propos des fruits. C'est une autre mauvaise analogie. Les études rassemblées ensembles pour une analyse ne devraient pas être comme des pommes et des oranges. S'il y en a, alors un type devrait être écarté. Vous voulez que toutes les études soient à propos de la même chose, et pas deux types de choses différentes à partir desquelles vous espérez pouvoir généraliser vers encore quelque chose de plus général! Vous n'examinez pas 25 études à propos de l'aspirine et 25 à propos des statines dans le but de généraliser à propos des pilules! Son seul exemple d'une méta-analyse dans ce chapitre concerne les aspirines où un intervalle de confiance de .99 fut utilisé (c'est-à-dire qu'il y a une chance sur cent que les résultats soient dûs au hasard). Aucune expérience psi n'a utilisé un standard aussi élevé. S'il avait utilisé l'habituel intervalle de confiance de .95 (une chance sur vingt que les résultats soient dûs au hasard), la majorité de ces études sur l'aspirine aurait été significatives d'un point de vue statistique. Les études sur les aspirines nous fournissent un bon exemple de comment une méta-analyse peut fournir une preuve forte en faveur de la signification de données, et ce même si dans plusieurs cas les études individuelles ont obtenu des résultats négatifs. Radin utilise un certain nombre de graphiques pour tenter de démontrer sa position concernant les méta-analyses. Son utilisation de données visuelles est selon moi problématique, et mérite un long commentaire, que je présente ci-dessous: Je pense qu'il propose aussi une fausse analogie lorsqu'il compare les études sur les aspirines avec les études sur le psi. Premièrement, les études sur les aspirines utilisent un standard plus élevé (un intervalle de confiance de 99%) que n'importe quelle étude sur le Psi (95%). Deuxièmement, l'interprétation des données est beaucoup plus ambiguë que dans le cas des recherches sur les aspirines. Radin termine le chapitre avec une comparaison entre les sciences dures et les sciences sociales en ce qui concerne la précision des mesures. Là encore, il s'agit d'une mauvaise analogie parce que les sciences dures utilisent un standard supérieur aux sciences sociales; les outils de mesures sont généralement plus précis dans les sciences dures, mais les items qui sont mesurés (comme les propriétés des particules sous-atomiques) sont difficiles à mesurer. Les sciences dures ont peut-être des critères plus précis pour déterminer quelles mesures sont à rejeter, mais dans tous les cas tout cela n'a rien à voir avec l'évaluation des méta-analyses. Ce point est important pour la question plus large de la précision des mesures, mais la comparaison avec la recherche sur le psi est problématique puisqu'il n'est jamais vraiment clair ce qui est prétendument mesuré dans les expériences sur les psi. Les distorsions et présentations incorrectes des données visuelles par RadinLa présentation visuelle des données par Radin en tant que point estimé au sein d'un intervalle de confiance est au mieux problématique, et au pire trompeuse et de la désinformation. Son premier graphique est à la page 34 de l'édition anglophone (page 59 de l'édition francophone de poche chez J'ai Lu: Aventure Secrète) et prétend présenter le « niveau réel de compétence » de Mickey Mantle en tant que batteur. Qui que ce soit de familier avec les moyennes de frappes au baseball ne trouvera rien d'intéressant dans ce graphique. Visuellement, il ne transmet aucune information ou faits, contrairement à un graphique en lignes avec les moyennes de frappes de Mantle chaque année comparée à une ligne de base, comme par exemple la moyenne de frappes de tous les joueurs centres de la League Américaine. Le concept de « véritable niveau de compétence » n'a aucun sens dans ce contexte. De plus, aucune statisticien n'appliquerait des intervalles de confiance à la seule moyenne de frappes d'un seul joueur de baseball. Quel est le sens d'affirmer que quand Mantle frappe .257, son véritable niveau se situe entre .235 et .310 avec un 95% d'intervalle de confiance? C'est du charabia! Quand Radin présente sa première méta-analyse (à la page 55 de l'édition anglophone et page 91 de l'édition francophone chez J'ai Lu), ce n'est pas à propos d'études sur le Psi mais une méta-analyse et 25 recherches sur les aspirines (cliquez ici pour voir le graphe). Ici, son point de données estimées à l'intérieur d'un intervalle de confiance n'est pas sans intérêt et ridicule comme il l'est dans l'exemple de Mickey Mantle. En fait, son approche n'est pas complètement trompeuse, parce qu'il masque l'importance et les informations fournies par les données de ces 25 études. Son visuel ne montre pas qu'il y avait 22071 médecins-sujets dans ces études et qu'il y avait 104 attaques cardiaques parmi les 11037 sujets dans le groupe aspirine et 189 attaques cardiaques parmi les 11034 sujets du groupe placébo. Son visuel ne montre pas que les probabilités que cette différence soit dûe au hasard est de l'ordre de 100000 contre 1. Son visuel ne montre pas qu'il y eu 44% moins d'attaques cardiaques dans le groupe aspirine ou même qu'il y eu 85 attaques cardiaques en moins dans le groupe aspirine. Évidemment, seulement 0.94% du groupe aspirine ont eu une attaque cardiaque, alors que 1.71% du groupe placébo en ont eu une. Cela ne semble pas être une différence si importante, mais comme aux États-Unis plus d'un demi-million de gens meurent chaque année d'une maladie du cœur et que 80% des décès dûs à des maladies cardiaques en-dessous de l'âge de 65 ans sont principalement causées par des attaques cardiaques, cela signifie qu'une aspirine par jour pourrait sauver des dizaines de milliers de vies chaque année. (Bien entendu, elles ne sont pas sauvées pour toute éternité. Ceux qui ne meurent pas cette année mourront éventuellement, probablement d'une maladie cardiaque. Quel serait le bénéfice exact qui résulterait de prendre une aspirine chaque jour est difficile à calculer. Qu'il est probable que cela produise un bénéfice chez ceux qui ont des maladies cardiaques est un bon pari. Quel bénéfice exactement est impossible à dire.) Avec la manière dont Radin présente ses données, seulement 5 des 25 recherches ont des résultats positifs (c'est-à-dire, avec un intervalle de confiance à 99% elles ont leurs deux extrêmes du côté positif du graphique). On peut se demander pourquoi il présente ces données avec un intervalle de confiance de 99% au lieu du classique 95%. Cela a peut-être avoir avec le fait que la plupart des études auraient leurs extrêmes du côté positif du graphique, ce qui dès lors annulerait son argument qu'un groupe d'études qui ne sont pas impressionnantes peuvent le devenir lorsqu'elles sont regroupées. Alors qu'il a raison de dire que « l'effet de l'aspirine fut déclaré « réel » sur base d'une combinaison de toutes les études », ce qui est vrai, il a tort lorsqu'il sous-entend que dans le cas des études sur les aspirines la plupart des études individuelles étaient non impressionnantes ou ne montraient pas un effet positif. Du coup, sa conclusion que « c'est très exactement ce que les méta-analyses ont fait pour les expériences sur le psi » est une grossière exagération. Du coup, non seulement sa représentation visuelle des données induit en erreur, mais elle désinforme. Elle ne révèle pas l'effet dramatique des aspirines en ce qui concerne la prévention des attaques cardiaques. De plus, Radin ne mentionne même pas que les études sur les aspirines ont été stoppée à mi-parcours parce que les données étaient si convaincantes qu'il aurait été problématique d'un point de vue éthique de continuer les recherches et de ne pas offrir les bénéfices de l'aspirine à ceux dans le groupe placébo, ainsi que de faire connaître leurs découvertes au grand public. Du coup, si les recherches avaient été réalisées jusqu'au bout, il est très probable qu'à l'intervalle de confiance de 95%, la grande majorité des études auraient été en faveur des effets positifs de l'aspirine. Radin a essayé de dépeindre l'étude de l'aspirine comme étant similaire aux recherches sur le psi: prenez un groupe de perdants, regroupez-les ensemble, et déclarez-les gagnants! C'est comme si vous pouviez prendre 20 ans de frappes au baseball en-dessous de .250, les regrouper ensemble, et de cette façon faire comme si d'une certaine manière magiquement cela produirait une moyenne pour l'ensemble de votre vie de .357. Au fait, il y a eu de nouvelles études sur les aspirines publiée depuis la sortie du livre de Radin en 1997, et la répétabilité est impressionnante. Je ne vais en mentionner qu'une seule. En 2003, une étude a trouvé que l'aspirine réduit le risque de la première attaque cardiaque par 32%. La recherche fut réalise à Mount Sinai Medical Center & Miami Heart Institute (MSMC-MHI) et fut publiée dans les Archives of Internal Medicine. L'étude était une méta-analyse de cinq importants essais randomisés qui impliquaient 55580 participants, dont 11466 femmes. Les chercheurs ont aussi trouvé que l'aspirine réduit le risque combiné des attaques cardiaques, des crises cardiaques et des morts vasculaires par 15%. Rien de similaire n'est venu de la recherche sur le Psi, bien que Radin ait continué a abuser du concept de méta-analyse. Dans son livre récent (Entangled Minds: p. 276), il a réalisé une méga-méta-analyse de plus de 1000 études sur les rêves psi, le ganzfeld psi, l'impression d'être regardé, l'intention à distance, la PK sur des dés et la PK sur des générateurs de nombres aléatoires. Il conclu que les chances contre le hasard d'obtenir ces résultats sont de 10104 (c'est un 10 avec 104 zéros après) contre 1. Radin semble croire qu'il peut construire le Taj Mahal à partir de pièces tirées d'une décharge publique. Il a en réalité créé un hologramme à partir de gaz des marais dans un rayon de la lune.
Fin de la cinquième partie.
(La dernière partie de l'article est en cours de traduction)
Traduit par Jean-Michel Abrassart (auteur du blog "Scepticisme scientifique" et du "balado de la Science et la raison"). Source : skepdic.com |
Accueil » Ressources » Dictionnaire sceptique » Radin, Dean
