Mal ús de l'estadística

De Viquipèdia
Dreceres ràpides: navegació, cerca

El mal ús de l'estadística, en anglès: misuse of statistics, ocorre quan un argument estadístic afirma una falsedat. En alguns casos el mal ús pot ser accidental. En altres té un propòsit i representa un guany per l'autor. Quan la raó estadística implicada és falsa o mal aplicada constitueix una fal·làcia estadística.

El parany de les falses estadístiques poden ser molt perjudicials per a la recerca del coneixement. Per exemple, en la ciència mèdica, per corregir una falsedat pot costar dècades i vides.

Pot ser fàcil de caure en l'ús incorrecte de les estadístiques. Els científics professionals, fins i tot els matemàtics i estadístics professionals, poden ser enganyats, fins i tot per alguns mètodes senzills, encara que hagin estat curosos en revisar-ho tot. Els científics són conscients que es poden enganyar amb les estadístiques a causa de la falta de coneixement de la teoria de la probabilitat i la manca de normalització de les seves proves.

Tipus de mal ús[modifica | modifica el codi]

  • Descartar les dades no favorables, en termes de control de qualitat una companyia comercial pot promoure un producte neutre però inútil del qual es faran estudis per demostrar que és beneficiós a base de descartar tant les proves sobre que és damnós com les dels (majoritaris) estudis no concloents

Una altra tècnica és preparar un estudi que provi un gran nombre de (respostes) de variables dependents al mateix temps. Per exemple en un estudi mèdic de l'efecte del tractament d'un medicament amb variables de la probabilitat de supervivència, el nombre de dies passats a l'hospital etc.

  • Les preguntes, les respostes a les enquestes poden estar manipulades per induir la prevalença a certes respostes. Per exemple respecte al suport a la guerra les preguntes:
    • Dóna suport a l'intent dels Estats Units de portar la llibertat i la democràcia a altres llocs del món?
    • Dóna suport a l'acció militar dels estats units?

Donaran probablement un resultat esbiaixat.

Una altra manera de fer això és precedir la pregunta amb informació que suporti la resposta "desitjada".

  • Sobregeneralització

La sobregeneralització és una fal·làcia que ocorre quan una estadística sobre una població particular s'afirma que tenen la mateixa opinió un grup en el qual la mostra de la població no es representativa.

Ocorre sovint la sobregeneralització quan la informació passa a ravés de fonts no tècniques com en el cas dels mitjans de comunicació[1][2]

  • Mostres esbiaixades
  • Informació errònia o mal entesa de l'error estimat:

La confiança en els resultats es pot quantificar pel teorema límit central i altres resultats matemàtics, la confiança s'expressa com una probabilitat que el resultat real (per a un gran grup) estigui dins un cert rang de l'estimat (la figura per un grup petit). Sovint no es menciona la probabiltat del nivell de confiança i així s'assumeix que és l'estàndard del 95%.

Els dos nombres estan relacionats. i una enquesta té un error estimatdel ±5% al 95% de confiança, també té un error estimat de ±6.6% al 99% de confiança. ±x% al 95% de confiança sempre és ±1.32x% al 99% de confiança.

  • Falsa causalitat

Quan una prova estadística mostra una correlació entre A i B, nrmalment hi ha cinc possibilitats:

  1. A causa B.
  2. B causa A.
  3. A i B tots dos parcialment causen l'altre.
  4. A i B tots dos són causats per un tercer factor, C.
  5. La correlació observada és purament fortuïta.

La fal·làcia, per exemple, pot ser usada per provar que l'exposició a un producte químic causa càncer.[3] això va passar en uns primers estudis que establien un lligam entre els camps electromagnètics i el càncer.[4]

  • Prova de la hipòtesi nul·la
  • Dragat de dades

El dragat de dades és l'abús de la mineria de dades. En el dragat de dades una gran compilació de dades s'examinen per tal de trobar-ne una correlació, sense cap hipòtesi predefinida.

  • manipulació de les dades

Inclou un informe selectiu o una simple fabricació de dades falses. Per exemple en el climategate es van escollir un grup de resultats que seguien el patró desitjat ignorant les altres dades.

  • Altres fal·làcies

La fal·làcia post facto assumix que un esdeveniment pel qual pot ser mesurat una probabilitat futura té la matixa probabilitat de passar una vegada realment hagi ocorregut.

Notes[modifica | modifica el codi]

Referències[modifica | modifica el codi]

A Wikimedia Commons hi ha contingut multimèdia relatiu a: Mal ús de l'estadística Modifica l'enllaç a Wikidata
  • Christensen, R. and T. Reichert, (1976) "Unit Measure Violations in Pattern Recognition, Ambiguity and Irrelevancy," Pattern Recognition, 4, 239–245. Pergamon Press.
  • Hooke, R. (1983) How to tell the liars from the statisticians; Marcel Dekker, Inc., New York, NY.
  • Jaffe, A.J. and H.F. Spirer (1987) Misused Statistics; Marcel Dekker, Inc., New York, NY.
  • Campbell, S.K. (1974), Flaws and Fallacies in Statistical Thinking; Prentice Hall, Inc., Englewood Cliffs, NJ.
  • Oldberg, T. (2005) "An Ethical Problem in the Statistics of Defect Detection Test Reliability," Speech to the Golden Gate Chapter of the American Society for Nondestructive Testing. Published on the Web by ndt.net at http://www.ndt.net/article/v10n05/oldberg/oldberg.htm.
  • Oldberg, T. and R. Christensen (1995) "Erratic Measure" in NDE for the Energy Industry 1995, The American Society of Mechanical Engineers. ISBN 0791812987 (pages 1-6) Republished on the Web by ndt.net
  • Ercan I, Yazici B, Yang Y, Ozkaya G, Cangur S, Ediz B, Kan I (2007) "Misusage of Statistics in Medical Researches", European Journal of General Medicine, 4 (3),127–133
  • Ercan I, Yazici B, Ocakoglu G, Sigirli D, Kan I Review of Reliability and Factors Affecting the Reliability, InterStat, 2007 April, 8
  • Stone, M. (2009) Failing to Figure: Whitehall's Costly Neglect of Statistical Reasoning, Civitas, London. ISBN 1906837074