Statistiques - Taille d'échantillon requise

Une partie critique du test est le choix de la mesure du test, c'est-à-dire la quantité d'unités à choisir parmi la population pour terminer l'exploration. Il n'y a pas de réponse ou de réponse sans équivoque pour caractériser la taille la plus appropriée. Il y a certainement des jugements erronés en ce qui concerne la durée du test, comme l'exemple devrait être de 10% de la population ou la taille de l'échantillon est relative à l'étendue de l'univers. Cependant, comme indiqué précédemment, ce ne sont que des jugements erronés. L'étendue d'un spécimen dépend de la capacité de la variété dans les paramètres de population étudiés et de l'exactitude de l'évaluation requise par le spécialiste.

La décision sur la taille optimale de l'échantillon peut être abordée sous deux angles à savoir. le subjectif et le mathématique.

  1. Approche subjective pour déterminer la taille de l'échantillon

  2. Approche mathématique de la détermination de la taille de l'échantillon

Approche subjective pour déterminer la taille de l'échantillon

Le choix de la taille de l'échantillon est influencé par divers facteurs décrits ci-dessous:

  • The Nature of Population- Le niveau d'homogénéité ou d'hétérogénéité influe sur l'étendue d'un échantillon. Si la population est homogène en ce qui concerne les qualités d'intérêt, alors même une petite taille du spécimen est adéquate. Cependant, dans le cas où la population est hétérogène, un exemple plus grand serait nécessaire pour garantir une représentativité suffisante.

  • Nature of Respondent- Si les répondants sont facilement accessibles et disponibles, les données requises peuvent être obtenues à partir d'un petit exemple. Au cas où, malgré tout, les intimés ne coopèrent pas et que la non-réaction est considérée comme élevée, un plus gros spécimen est alors nécessaire.

  • Nature of Study- Une étude ponctuelle peut être menée en utilisant un exemple substantiel. S'il devait y avoir une occurrence d'études d'examen qui sont de nature constante et doivent être sérieusement achevées, un petit spécimen est plus approprié car il est tout sauf difficile à surveiller et à garder un petit exemple sur une longue période de temps.

  • Sampling Technique Used- Une variable essentielle affectant la durée du test est le système d'examen reçu. Premièrement, un système de non-vraisemblance nécessite un plus gros spécimen qu'une stratégie de vraisemblance. Outre les tests de vraisemblance, si un examen irrégulier simple est utilisé, il nécessite un plus grand exemple que si la stratification est utilisée, où un petit échantillon est suffisant.

  • Complexity of Tabulation- En se fondant sur l'estimation du spécimen, le spécialiste doit également considérer la quantité de classifications et de classes dans lesquelles les découvertes doivent être rassemblées et décomposées. On a vu que plus la quantité de classifications à produire est grande, plus la taille de l'exemple est grande. Puisque chaque classe doit être suffisamment parlée, un plus gros spécimen est nécessaire pour donner des mesures solides de la plus petite classification.

  • Availability of Resources- Les atouts et le temps accessibles au spécialiste ont un impact sur la durée du test. L'examen est une affectation à durée indéterminée et en espèces, avec des exercices tels que l'état de préparation de l'instrument, la passation de marchés et la préparation du personnel sur le terrain, les frais de transport, etc., prenant une part considérable des actifs. Par la suite si le scientifique n'a pas assez de temps et de supports accessibles, il se contentera d'un plus petit exemple.

  • Degree of Precision and Accuracy Required-. Il s'est avéré clair d'après notre discours antérieur que la précision, qui est mesurée par une erreur standard, sera élevée juste si SE est inférieure ou si la taille de l'exemple est substantielle.

De plus, pour obtenir un haut niveau de précision, un spécimen plus grand est nécessaire. En dehors de ces efforts subjectifs, la taille de l'échantillon peut également être déterminée mathématiquement.

Approche mathématique de la détermination de la taille de l'échantillon

Dans l'approche mathématique de la détermination de la taille de l'échantillon, la précision de l'estimation requise est d'abord indiquée, puis la taille de l'échantillon est calculée. La précision peut être spécifiée comme $ {\ pm} $ 1 de la vraie moyenne avec un niveau de confiance de 99%. Cela signifie que si la moyenne de l'échantillon est de 200, alors la valeur réelle de la moyenne sera comprise entre 199 et 201. Ce niveau de précision est désigné par le terme «c»

Détermination de la taille de l'échantillon pour les moyennes.

L'intervalle de confiance pour la moyenne de l'univers est donné par

$ {\ bar x \ pm Z \ frac {\ sigma_p} {\ sqrt N} \ ou \ \ bar x \ pm e} $

Où -

  • $ {\ bar x} $ = Moyenne de l'échantillon

  • $ {e} $ = Erreur acceptable

  • $ {Z} $ = Valeur de la variable normale standard à un niveau de confiance donné

  • $ {\ sigma_p} $ = écart-type de la population

  • $ {n} $ = Taille de l'échantillon

L'erreur acceptable 'e' c'est-à-dire la différence entre $ {\ mu} $ et $ {\ bar x} $ est donnée par

$ {Z. \ frac {\ sigma_p} {\ sqrt N}} $

Ainsi, la taille de l'échantillon est:

$ {n = \ frac {Z ^ 2 {\ sigma_p} ^ 2} {e ^ 2}} $

Ou

Dans le cas où la taille de l'échantillon est significative vis-à-vis de la taille de la population, la formule ci-dessus sera corrigée par le multiplicateur de population finie.

$ {n = \ frac {Z ^ 2.N. {\ sigma_p} ^ 2} {(N-1) e ^ 2 + Z ^ 2. {\ sigma_p} ^ 2}} $

Où -

  • $ {N} $ = taille de la population

Détermination de la taille de l'échantillon pour les proportions

La méthode de détermination de la taille de l'échantillon lors de l'estimation d'une proportion reste la même que la méthode d'estimation de la moyenne. L'intervalle de confiance pour la proportion d'univers $ {\ hat p} $ est donné par

$ {p \ pm Z. \ sqrt {\ frac {pq} {n}}} $

Où -

  • $ {p} $ = proportion de l'échantillon

  • $ {q = (1 - p)} $

  • $ {Z} $ = Valeur de la variable normale standard pour une proportion d'échantillon

  • $ {n} $ = Taille de l'échantillon

Puisque $ {\ hat p} $ doit être estimé, la valeur de p peut être déterminée en prenant la valeur de p = 0,5, une valeur acceptable, ce qui donne une taille d'échantillon prudente. L'autre option est que la valeur de p est estimée soit par une étude pilote, soit sur la base d'un jugement personnel. Étant donné la valeur de p, l'erreur acceptable 'e' est donnée par

$ {e = Z. \ sqrt {\ frac {pq} {n}} \\ [7pt] e ^ 2 = Z ^ 2 \ frac {pq} {n} \\ [7pt] n = \ frac {Z ^ 2.pq} {e ^ 2}} $

Si la population est finie, la formule ci-dessus sera corrigée par le multiplicateur de population finie.

$ {n = \ frac {Z ^ 2.pqN} {e ^ 2 (N-1) + Z ^ 2.pq}} $

Exemple

Problem Statement:

Un magasin d'achats souhaite estimer la proportion de ménages possédant la carte de membre Privilege. Des études antérieures ont montré que 59% des ménages avaient une carte de crédit en magasin. À un niveau de confiance de 95% avec un niveau d'erreur tolérable de 05.

  1. Déterminez la taille de l'échantillon nécessaire pour mener l'étude.

  2. Quelle serait la taille de l'échantillon si l'on sait que le nombre de ménages cibles est de 1 000?

Solution:

Le magasin a les informations suivantes

$ {p = .59 \\ [7pt] \ Rightarrow q = (1-p) = (1-.59) = .41 \\ [7pt] CL = .95 \\ [7pt] Et \ le \ Z \ \ variate \ standard pour \ CL \ .95 \ est \ 1.96 \\ [7pt] e = \ pm .05} $

La taille de l'échantillon peut être déterminée en appliquant la formule suivante:

$ {n = \ frac {Z ^ 2.pq} {e ^ 2}} $
$ {n = \ frac {(1,96) ^ 2. (. 59). (. 41)} {(. 05) ^ 2} \\ [7pt] = \ frac {.9226} {. 0025} \\ [ 7pt] = 369} $

Un échantillon de 369 ménages est donc suffisant pour mener l'étude.

Étant donné que la population, c'est-à-dire les ménages cibles, est connue pour être de 1 000 et que l'échantillon ci-dessus représente une proportion significative de la population totale, c'est pourquoi la formule corrigée qui comprend un multiplicateur de population finie est utilisée.

$ {n = \ frac {Z ^ 2.pqN} {e ^ 2 (N-1) + Z ^ 2.pq} \\ [7pt] = \ frac {(1.96) ^ 2. (. 59). ( .41). (1000)} {(. 05) ^ 2 \ fois 999 + (1.96) ^ 2 (.59) (. 41)} \\ [7pt] = \ frac {922.6} {2.497 + .922} \\ [7pt] = 270} $

Ainsi, si la population est finie avec 1000 ménages, la taille de l'échantillon nécessaire pour mener l'étude est de 270.

Il est évident d'après cette illustration que si la taille de la population est connue, la taille de l'échantillon déterminée a diminué en taille.