Disseny d'experiments

De Viquipèdia
Dreceres ràpides: navegació, cerca

El disseny d'experiments o disseny experimental, en anglès: Design of experiments (DOE) o experimental design és el disseny de qualsevol exercici de recollida d'informació on es presenta variació, sigui sota el control total de l'experiment o no. Tanmateix en estadística, aquests termes normalment es fan servir per experiments controlats. Vegeu experiment per la distinció entre els tipus d'experiments o estudis.

En el disseny d'experiments, l'experiment sovint està interessat en l'efecte d'alguns processos o intervencions (el "tractament") sobre alguns objectes (les "unitats experimentals"), les quals poden ser les persones, parts de les persones, grups de persones, plantes, animals, materials, etc. El disseny d'experiments és una disciplina que té moltes aplicacions en les ciències naturals i socials.

Història[modifica | modifica el codi]

El 1747, quan exercia de cirurgià al vaixell HM Bark Salisbury, James Lind va portar a terme un experiment controlat per tal de guarir l'escorbut.[1] i els homes, dels 12, als quals se'ls va administrar fruits cítrics es van recuperar ràpidament mentre que amb altres tractaments (gotes d'àcid sulfúric, aigua de mar. vinagre etc.) van suposar només una millora.

Charles S. Peirce en una publicació del 1877 va desenvolupar la teoria de la inferència estadística on n'emfatitzava la importància de l'aleatorietat. Charles S. Peirce aleatòriament va assignar voluntaris en un experiment aleatori a cegues per avaluar la seva capacitat de discriminar pesos.[2][3][4][5] Els experiments de Peirce inspiraren altres investigadors en psicologia i educació al segle XIX.[2][3][4][5]


Principis del disseny experimental, segons Ronald A. Fisher[modifica | modifica el codi]

Ronald A. Fisher proposà una metodologia en el seu llibre The Design of Experiments (1935). Com un exemple va descriure com provar la hipòtesi que una dona podria distingir només pel gust si es va posar primer la llet o el te en una tassa. Encara que sembli una frivolitat permetil·lustrar les idees més importants del disseny experimental:

Comparació
En molts camps d'estudi és difícil reproduir les mesures dels resultats exactament. La comparació entre tractaments és més reproduïble i normalment és preferible. Sovint es compara entre un control científic estàndard o un tractament tradicional que fa de línia de base.
Aleatorització
Hi ha una gran quantitat de teoria matemàtica sobre aquest tema que proporciona si la mida de la mostra és l'adequada, si el risc associat amb l'aleatorització és calculable etc.
Replicació estadística
Els mesuraments estan subjectes a la variació i la incertesa. Les mesures es repeteixen i els experiments complets es repliquen per ajudar a identificar les fonts de variació i estimar millor els vertaders efectes dels tractaments.
Agrupament estadístic
Agrupar o bloquejar és disposar les unitats experimentals en grups (blocks) consistents en unitats que són similars. Amb això es redueix les fonts conegudes però irrellevants de variació entre les unitats i permet més precisió.
Ortogonalitat
Exemple de disseny factorial ortogonal
L'ortogonalitat afecta les formes de comparació (contrasts) que es poden portar a terme de manera eficient i legítima. Els contrasts es poden representar per vèctors i grups de contrasts ortogonals i no estan correlacionats i són distribuïts independentment si les dades són normals. Per això proporcionen informació diferent.
Experiment factorials
Fan servir experiments factorials en lloc del mètode d'un factor a la vegada. Són eficients per avaluar els efectes de les possibles interaccions de diversos factors independents (variables independents).


Exemple[modifica | modifica el codi]

Balances

Aquest exemple s'atribueix a Harold Hotelling.[6]

S'han de mesurar els pes de vuit objectes fen servir una balança de plats (balance pan) i un conjunt de peses estàndard. Cada pesada mesura les diferències de pes entre els objectes posats a l'esquerra del plat contra els pesos calibrats posats a la dreta fins a l'equilibri de la balança. Cada mesurament té errors, l'error mitjà és zero; la desviació estàndard de la distribució de probabilitat dels errors és el mateix nombre σ sobre diferents pesades; els errors sobre les diferents pesades són estadísticament independents. Denoten els autèntics pesos per

\theta_1, \dots, \theta_8.\,

Es consideren dos experiements diferents:

  1. Pesar cada objecte en un plat de la balança, amb l'altre plat buit. Sigui que Xi sigui el pes mesurat de l'objecte iè, per i = 1, ..., 8.
  2. Es fan les vuit pesades programades i sigui Yi la diferència mesurada per i = 1, ..., 8:

\begin{matrix}
& \mbox{left pan} & \mbox{right pan} \\
\mbox{1st weighing:} & 1\ 2\ 3\ 4\ 5\ 6\ 7\ 8 & \text{(empty)} \\ 
\mbox{2nd:} & 1\ 2\ 3\ 8\ & 4\ 5\ 6\ 7 \\
\mbox{3rd:} & 1\ 4\ 5\ 8\ & 2\ 3\ 6\ 7 \\
\mbox{4th:} & 1\ 6\ 7\ 8\ & 2\ 3\ 4\ 5 \\
\mbox{5th:} & 2\ 4\ 6\ 8\ & 1\ 3\ 5\ 7 \\
\mbox{6th:} & 2\ 5\ 7\ 8\ & 1\ 3\ 4\ 6 \\
\mbox{7th:} & 3\ 4\ 7\ 8\ & 1\ 2\ 5\ 6 \\
\mbox{8th:} & 3\ 5\ 6\ 8\ & 1\ 2\ 4\ 7
\end{matrix}
Aleshores el pes estimat θ1 és
\widehat{\theta}_1 = \frac{Y_1 + Y_2 + Y_3 + Y_4 - Y_5 - Y_6 - Y_7 - Y_8}{8}.
Similars estimacions es poden trobar pels altres pesos. Per exemple
\widehat{\theta}_2 = \frac{Y_1 + Y_2 - Y_3 - Y_4 + Y_5 + Y_6 - Y_7 - Y_8}{8}.

La pregunta del disseny d'experiment és: quin experiment és millor?

La variança de l'estimada X1 de θ1 és σ2 si fem servir el primer experiment. Però si fem servir el segon la variança és σ2/8. Per això el segon experiment dóna vuit vegades millor precisió.

Notes[modifica | modifica el codi]

  1. Dunn, Peter. «James Lind (1716-94) of Edinburgh and the treatment of scurvy». Archive of Disease in Childhood Foetal Neonatal. British Medical Journal Publishing Group [United Kingdom], 76, 1, gener 1997, pàg. 64–65. DOI: 10.1136/fn.76.1.F64. PMC: 1720613. PMID: 9059193 [Consulta: 17 gener 2009].
  2. 2,0 2,1 Peirce, Charles Sanders; Jastrow, Joseph «On Small Differences in Sensation». Memoirs of the National Academy of Sciences, 3, 1885, pàg. 73–83.
  3. 3,0 3,1 Hacking, Ian. «Telepathy: Origins of Randomization in Experimental Design». Isis, 79, 3, September 1988, pàg. 427–451. DOI: 10.1086/354775. JSTOR: 234674.
  4. 4,0 4,1 Stephen M. Stigler. «A Historical View of Statistical Concepts in Psychology and Educational Research». American Journal of Education, 101, 1, November 1992, pàg. 60–70. DOI: 10.1086/444032. JSTOR: 1085417.
  5. 5,0 5,1 Trudy Dehue. «Deception, Efficiency, and Random Groups: Psychology and the Gradual Origination of the Random Group Design». Isis, 88, 4, December 1997, pàg. 653–673. DOI: 10.1086/383850.
  6. Herman Chernoff, Sequential Analysis and Optimal Design, SIAM Monograph, 1972.

Referències[modifica | modifica el codi]

Peirce, C. S. (1877–1878), "Illustrations of the Logic of Science" (series), Popular Science Monthly, vols. 12-13. Relevant individual papers:

    • (1878 March), "The Doctrine of Chances", Popular Science Monthly, v. 12, March issue, pp. 604–615. Internet Archive Eprint.
    • (1878 April), "The Probability of Induction", Popular Science Monthly, v. 12, pp. 705–718. Internet Archive Eprint.
    • (1878 June), "The Order of Nature", Popular Science Monthly, v. 13, pp. 203–217.Internet Archive Eprint.
    • (1878 August), "Deduction, Induction, and Hypothesis", Popular Science Monthly, v. 13, pp. 470–482. Internet Archive Eprint.
  • Peirce, C. S. (1883), "A Theory of Probable Inference", Studies in Logic, pp. 126-181, Little, Brown, and Company. (Reprinted 1983, John Benjamins Publishing Company, ISBN 9027232717)

Bibliografia[modifica | modifica el codi]

Vegeu també[modifica | modifica el codi]

Enllaços externs[modifica | modifica el codi]