Physique Chimie
  | Accueil |         
  Melzani M.,
lycée Pierre de
Coubertin,
Meaux
CPGE TSI2 :  |  documents cours |  TP, DS, maths... |  colles |  cahier texte |  concours |  actualités | 
Autres :       |  plasmas |  agrégation |  archives 2016-2017 |  notes diverses |  épistémologie |  liens | 

  Agrégation de sciences physiques, option physique/

Rubriques :

Plans, remarques, comptes rendus |
Traitements des incertitudes |
Régression linéaire et incertitudes |
Références incertitudes |




Traitement des incertitudes

Le traitement des incertitudes est un élément clé de la démarche scientifique. Par nature, une mesure est associée à une incertitude. C'est grâce à l'estimation de celle-ci que l'on peut dire si oui ou non les mesures expérimentales sont compatibles avec les prédictions théoriques. Sans incertitudes elles ne le seraient jamais strictement et toujours à peu près... et la science n'avancerait pas.

Comment présenter le formalisme et les outils liés aux incertitudes ? Tout dépend bien sûr du niveau visé, et on ne dira pas la même chose dans une classe de terminale, dans une CPGE, en préparation à l'agrégation ou en Master de métrologie...

Les notes qui suivent visent plutôt le niveau agrégation, niveau pour lequel les mesures effectuées ne sont pas si précises que cela, le nombre de points souvent inférieur à la dizaine, les lois de distribution des incertitudes inconnues... Un traitement rigoureux des incertitudes ne semble donc pas justifié, et serait même parfois un peu ridicule. Encore faut-il savoir en quoi consiste ou consisterait le traitement dans sa version rigoureuse, afin de pouvoir justifier pleinement une approche approchée. C'est l'objectif de ces notes.




Plan

La suite de cette page n'est pas un cours complet sur les incertitudes, elle vise plutôt à approfondir et préciser certains points. Il est donc supposé que le lecteur connait déjà les éléments de base.

On peut par ailleurs consulter le polycopié (lien) donné dans ma classe de TSI2 qui résume les points de base sur la gestion des incertitudes. Mais attention, il s'agit d'un polycopié pour des étudiants en CPGE et qui est donc de niveau introductif - certains raccourcis pourront paraître choquants.

Plan du présent document :




Généralités et recettes pratiques

Lorsque l'on donne une incertitude, il faut l'associer à un intervalle de confiance.

Par exemple on dira que nos mesures de longueur d'onde d'une raie spectrale mènent à l'estimation $\lambda = 547 \pm 3\,\mathrm{nm}$ avec un intervalle de confiance de 95%. Cela signifie que la valeur vraie a 95% de probabilité de se situer dans l'intervalle donné.

L'idée générale que l'on cherche à justifier ici est que, pour un TP dans le secondaire, en CPGE ou en préparation à l'agrégation, il suffit d'utiliser les règles suivantes :

  • L'intervalle à $\pm$ une incertitude type, $x \pm u(x)$, correspond à un intervalle de confiance de 70% environ.

  • Pour obtenir l'intervalle de confiance élargi à 95%, écrit $x \pm \Delta x_{95\%}$, on peut utiliser $\Delta x_{95\%} \simeq 2u(x)$.

    Si on veut déduire $u(x)$ à partir de $\Delta x_{95\%}$, on peut utiliser de même $u(x) \simeq \Delta x_{95\%}/2$.

  • Lors du calcul d'une incertitude sur une grandeur composée, par exemple $f = f(x,y,z)$, on utilise la formule de propagation des erreurs indifféremment pour les incertitudes types (ce qui est rigoureux si les $x_i$ sont indépendants) ou pour les incertitudes élargies (ce qui n'est pas rigoureux, mais permis par le fait qu'on utilise ici $\Delta x_{95\%} \simeq 2u(x)$ pour toutes les grandeurs).

  • Lors d'une estimation d'incertitude de type A, on oublie les coefficients de Student. On estime l'incertitude type avec la formule habituelle en $u(\bar{x}) = \sigma_\text{exp}/\sqrt{N}$, et on l'élargie à 95\% en multipliant là encore par 2.

  • On estime les incertitudes de type B en faisant preuve de bon sens et sans se soucier des distributions suivies : un instrument gradué à $2\delta$ près donne une incertitude élargie pour $\pm\delta$ et son écart type est de $\delta/2$, une notice constructeur indique une incertitude élargie (sauf mention contraire), etc. (voir polycopié incertitudes pour une liste).

 

Reprenons chacun de ces points dans l'ordre et expliquons pourquoi ils ne sont pas tout à fait corrects :

  • L'intervalle $x\pm u(x)$ correspond à un niveau de confiance de 68% pour une loi qui suit une distribution gaussienne. C'est différent pour une distribution uniforme, triangle, de Student, etc... Voir paragraphe sur les intervalles de confiance.

  • De même, on a la relation $\Delta x_{95\%} \simeq 2u(x)$ ($1.96u(x)$ pour être précis) pour une loi gaussienne seulement. Le coefficient d'élargissement est différent de 2 pour d'autres lois. Voir ici aussi le paragraphe sur les intervalles de confiance.

  • Si on a une fonction $f(x,y,z)$, la densité de probabilité de $f$ est en générale difficile à obtenir et n'est que rarement gaussienne (elle l'est si $f$ est la somme de variables indépendantes gaussiennes, mais c'est à peu près le seul cas). On peut donc calculer l'incertitude type $u(f)$ par la formule de propagation des incertitudes, mais on ne peut pas en déduire facilement $\Delta f_{95\%}$. On verra toutefois qu'utiliser un facteur d'élargissement de 2, que la loi soit uniforme ou triangulaire ou autre, mène à un résultat suffisamment proche du résultat rigoureux pour pouvoir être utilisé (voir paragraphe sur la propagation des incertitudes, et paragraphe d'illustration avec $f(x_1,x_2)=x_1-x_2$).

  • En toute rigueur l'intervalle de confiance à 95% est donné par $\pm u(\bar{x})\times t_{95\%}^{N-1}$ (sous l'hypothèse de $x_i$ gaussiens). On verra dans le paragraphe sur l'incertitude de type A que le coefficient de Student $t_{95\%}^{N-1}$ est proche de 2 (2.8 pour 5 points, 2.3 pour 10 points), et on rappellera que l'incertitude sur l'incertitude type $u(\bar{x})$ est elle-même de 24% au moins pour moins de 10 points... Ce qui rend superflue l'utilisation de $t_{95\%}^{N-1}$.

  • En toute rigueur, il faudrait utiliser une loi uniforme pour un instrument gradué, une loi triangle pour estimer une plage de netteté, etc. (et encore, cela se discute...).

    On a alors des relations exactes, par exemple pour une loi uniforme $x$ de demi-largeur $\delta$ on a $u(x)=\delta/\sqrt{3}$ et $\Delta x_{95\%} = 1.6\delta/\sqrt{3}$. Mais $1.6/\sqrt{3} = 0.92$, et on comprend bien qu'on peut arrondir ceci à $\Delta x_{95\%} = \delta$, ce qui a l'avantage d'être intuitif, et n'a aucun impact sur la précision de la discussion étant donné qu'il y a toujours globalement une incertitude sur l'incertitude de l'ordre de 10% à 20%, voire plus.

Les paragraphes qui suivent permettent de justifier les approximations ci-dessus. Il faut les lire en ayant à l'esprit que l'estimation de l'incertitude est... une estimation. On peut montrer par exemple que sur une série de mesures, l'incertitude de type A obtenue possède elle-même une incertitude de l'ordre de 10% tant qu'on ne dépasse pas la vingtaine de points. C'est aussi pour cela qu'on conseille de ne garder qu'un chiffre significatif dans l'écriture de l'incertitude.




Propagation des incertitudes sur une mesure et intervalle de confiance, facteur d'élargissement

On considère une grandeur $f$ qui dépend d'autres grandeurs $x_1$, ..., $x_n$.

Par exemple on mesure une distance $d$, un temps de chute $t$, et on souhaite en déduire la vitesse $f = d/t$.

Si on note $u(x_i)$ l'incertitude type de la variable $x_i$, et qu'on suppose les $x_i$ indépendants, alors l'incertitude type sur $f$ est :

\begin{equation} u(f) = \sqrt{\sum_{i=1}^N\left(\dfrac{\partial f}{\partial x_i}\right)^2 u(x_i)^2}. \end{equation}

Diverses remarques :

  • Si les $x_i$ ne sont pas indépendants, on doit utiliser $u(f)^2 = \sum_{i,j=1}^N\dfrac{\partial f}{\partial x_i}\dfrac{\partial f}{\partial x_j} \text{cov}(x_i,x_j)$.

  • On peut généraliser cette formule à la combinaison d'incertitudes de type A et B : ce sont bien les carrés des incertitudes types qui s'ajoutent, $u(f)^2 = u(x)_\text{type~A}^2 + u(x)_\text{type~B}^2$.

    Par exemple $u(x)_\text{type~A}$ peut être une incertitude calculée sur plusieurs réalisations d'une expérience de chute d'une réglette, et $u(x)_\text{type~B}$ l'incertitude issue de la notice constructeur du chronomètre utilisé.

  • Ce ne sont que les incertitudes types qui s'ajoutent (et certainement pas les incertitudes élargies).

    Rappelons qu'une incertitude type est définie comme l'écart type de la distribution de probabilité $p(x)$ : $u(x) = \sqrt{\int p(x) (x-\bar{x})^2}$.

    Si on veut obtenir une formule donnant l'incertitude élargie sur $f$, associée à un certain intervalle de confiance, c'est impossible en général. Idem si on veut connaître l'intervalle de confiance associé à $\pm u(f)$. La raison est que l'on ne connaît pas la distribution de probabilité de $f$.

    Il y a néanmoins plusieurs cas qui peuvent permettre d'obtenir un résultat :

    • Une somme de variables aléatoires gaussiennes indépendantes est une variable aléatoire gaussienne. Mais on rencontre rarement ce cas en pratique.

    • Une somme de $N$ variables aléatoires indépendantes est une variable aléatoire dont la distribution tend vers une gaussienne lorsque $N\gg 1$ (si les va sont les mêmes et de variance finie, et même si elles sont différentes sous certaines conditions). Ceci peut-être utilisé lorsque $f = \dfrac{1}{N}\sum_i x_i$ est une moyenne.

    • On peut réaliser des simulations Monte Carlo afin d'obtenir des résultats rigoureux au cas par cas si on connait les distributions de chacun des $x_i$. Le logiciel Gum MC permet de faire ceci.

    • Certaines fois le calcul est possible. Voir paragraphe suivant où on traite le cas $f(x_1,x_2) = x_1-x_2$.




Un exemple d'incertitude composée : $f(x_1,x_2) = x_1-x_2$

On s'intéresse au cas de $f(x_1,x_2) = x_1-x_2$. C'est un cas plutôt fréquent, car il arrive à chaque fois qu'on mesure une quantité par différence : différence de longueurs, de volumes, d'angles, etc.

On suppose qu'il y a égalité des incertitudes types : $u(x_1)=u(x_2)$, que l'on note $u(x)$.

La formule de propagation des incertitudes (types) indique que $u(f)^2 = u(x_1)^2+u(x_2)^2$, d'où ${u(f) = \sqrt{2}u(x).}$

  • Comment interpréter ce résultat ? Pourquoi n'est-ce pas $u(f) = 2\times u(x)$ ?

    Simplement, il est rare qu'une erreur sur $x_1$ et une erreur sur $x_2$ aillent dans le même sens. Si je mesure un angle $\theta_1$, puis un angle $\theta_2$, il est rare que je fasse une erreur qui surestime $\theta_1$ et en même temps une qui surestime $\theta_2$. C'est pourquoi l'incertitude type de $f$ n'est pas $2\times u(x)$, mais est plus faible.

  • Comment ensuite obtenir une incertitude élargie à 95% à partir de $u(f)$ ?

    On suppose que $x_1$ et $x_2$ sont distribués selon des loi uniformes (rectangulaires) de demi-largeurs $\delta$. Pour une règle graduée au millimètre, $2\delta = 1\,$mm.

    • Si on reste approximatif, on multiplie $u(f)$ par deux : $\Delta f_{95\%} = 2u(f)$. Comme on est aussi approximatif sur $x_1$ et $x_2$, on a $\Delta x_{95\%} = 2u(x)$, et donc $\Delta f_{95\%} = \sqrt{2}\Delta x_{95\%}$. Pour un instrument gradué tous les $2\delta$, on a $\Delta x_{95\%} \simeq \delta$, et donc $\Delta f_{95\%} = \sqrt{2}\delta$.

    • Cependant, pour être rigoureux il faut bien comprendre que la loi suivie par $f$ n'est pas gaussienne, et que le facteur d'élargissement n'est donc pas 2.

      Dans le cas présent, on peut montrer soit mathématiquement soit avec une simulation Monte Carlo via Gum MC (lien vers le logiciel) que si $x_1$ et $x_2$ sont distribués selon des loi uniformes (rectangulaires) de demi-largeurs $\delta$, alors l'histogramme de $f$ est une distribution triangle de demi-largeur $2\delta$ (ce qui est logique si on y réfléchit).

      Le second tableau ci-dessous indique alors que $\Delta f_{95\%}$ est la demi-largeur multipliée par $0.8$, d'où $\Delta f_{95\%} = 0.8\times2\delta$.

    En conclusion, l'approche rigoureuse donne $\Delta f_{95\%} = 1.6\delta$, et l'approche approximative $\Delta f_{95\%} = 1.4\delta$. On voit qu'il n'y a pas de différence significative.

    On pourrait même d'ailleurs oublier le $\sqrt{2}$ de l'approche approximative et utiliser $\Delta f_{95\%} = 2\delta$.




Incertitude de type B

C'est une incertitude associée à une seule mesure. Voir le polycopié sur les incertitudes (lien) pour des méthodes dans différents cas (règle ou autre instrument gradué tel que goniomètre, burette, banc optique ; instrument jaugé ; voltmètre ; oscilloscope ; ...).




Incertitude de type A, coefficient de Student

Voir le polycopié pour des généralités.

C'est une incertitude statistique, pour des séries de mesures répétées $N$ fois (plus de $\sim$ 5 fois pour que cela ait un sens statistique).

On a donc une série de mesures $x_1$, $x_2$, ..., $x_N$ d'un même mesurande. Par exemple, on mesure plusieurs fois le temps de chute d'un objet depuis une hauteur de 1\,m.

On peut estimer l'incertitude type de $x$ à l'aide de l'écart type de la série de données :

\begin{equation} u(x) = \sigma = \sqrt{\dfrac{1}{N-1}\sum_{i=1}^{N}(x_i-\bar{x})^2}. \end{equation}

Alors :

  • La meilleure estimation de la valeur vraie $X_\text{vraie}$ est la moyenne des mesures :

    \begin{equation} \bar{x} = \dfrac{1}{N}\sum_{i=1}^N x_i. \end{equation}
  • La meilleur estimation de l'incertitude type de $\bar{x}$, $u(\bar{x})$, est l'écart-type de la série de donnée, divisée par $\sqrt{N}$ :

    \begin{equation} \begin{split} u(\bar{x}) &= \dfrac{1}{\sqrt{N}}\times\sigma \\ & = \dfrac{1}{\sqrt{N}}\sqrt{\dfrac{1}{N-1}\sum_{i=1}^{N}(x_i-\bar{x})^2}. \end{split} \end{equation}

    On rappelle en effet que l'écart-type d'une série de données donne une idée de la dispersion ou de l'étalement des données. Le facteur $1/\sqrt{N}$ montre que plus on fait de mesures, plus l'incertitude sera faible et donc plus le résultat sera précis. Attention, il ne s'agit pas réellement de l'incertitude type de la v.a. $\bar{x}$, mais d'une estimation de celle-ci. En toute rigueur on devrait la noter autrement.

Attention, comme d'habitude : (i) on ne connaît pas le niveau de confiance $\alpha$ associé à l'intervalle $\bar{x}\pm u(\bar{x})$ et (ii) on ne connaît pas le facteur d'élargissement par lequel multiplier $u(\bar{x})$ si on veut obtenir un niveau de confiance donné (de 95% par exemple), ceci parce qu'on ne connaît pas la loi de probabilité suivie par $\bar{x}$.

Comment faire ?

Il faut au moins faire une hypothèse sur la loi suivie par les $x_i$. On suppose donc qu'il s'agit d'une loi normale. Ainsi la moyenne $\bar{x}$, qui est une somme de v.a. normale, suit une loi normale. Mais on ne connaît pas en pratique son incertitude type : on ne peut donc pas utiliser ce résultat directement. Au lieu de cela, on possède une estimation de l'incertitude type, $u(\bar{x})$ donné ci-dessus.

On peut alors démontrer que l'intervalle $\bar{x} \pm t_\alpha^{N-1} u(\bar{x})$ correspond à un niveau de confiance $\alpha$, où $t_\alpha^{N-1}$ est appelé coefficient de Student.

Précisons les valeurs de $t_\alpha^{N-1}$ :

\begin{array}{|c|c|c|} \text{Niveau de confiance} & 70\% & 95\% \\ \hline \text{Nombre de points} & & \\ 3 & 1.39 & 12.7 \\ 5 & 1.19 & 2.78 \\ 7 & 1.13 & 2.45 \\ 10 & 1.1 & 2.26 \\ 15 & 1.08 & 2.15 \\ 30 & 1.06 & 2.05 \\ \infty & 1.04 & 1.96 \\ \end{array}

Coefficient de Student $t_\alpha^{N-1}$. Il existe des tables sur internet. Attention, comme on considère un intervalle bilatéral, il faut lire dans ces tables avec le niveau $1-(1-\alpha)/2$. Cf la table du wikipédia anglais.


La question est donc de savoir si on peut utiliser la recette approximative $\Delta\bar{x}_{95\%} \simeq 2u(\bar{x})$ avec $u(\bar{x})$ estimé ci-dessus. La table nous apprend que le résultat rigoureux est $\Delta\bar{x}_{95\%} = 2.8u(\bar{x})$ pour 5 mesures, $2.3u(\bar{x})$ pour 10 mesures, etc. J'aurais donc tendance à dire que oui, on peut. D'autant plus si on se souvient que la statistique suivie par les $x_i$ n'est pas nécessairement gaussienne, et que même dans ce cas $u(\bar{x})$ est un estimateur de l'écart type de la loi, qui présente lui même une incertitude dont on montre qu'elle est de 24% pour $N=10$ et de 10% pour $N=50$, ce qui n'est pas rien.


Attention enfin, toute cette approche statistique n'a d’intérêt que si l'erreur commise lors de la lecture est aléatoire, et grossièrement gaussienne. Une condition essentielle est qu'il faut que l'instrument de mesure soit assez précis pour que l'erreur commise soit aléatoire. S'il ne l'est pas, il faut ajouter à l'incertitude de type A celle de type B, liée à l'imprécision de l'appareil, selon la formule :

\begin{equation} \delta x = \sqrt{\Delta x_\text{type~A}^2 + \Delta x_\text{type~B}^2}. \end{equation}

Ainsi si $\Delta x_\text{type~A} \ll \Delta x_\text{type~B}$ il n'est pas utile de le considérer.

Cette dernière formule est générale, et s'applique en fait dans tous les cas (voir exemples ci-dessous).




Exemples concrets pour savoir quand utiliser type A, B ou les deux

Premier exemple : on mesure une distance avec une règle graduée au millimètre. Réaliser plusieurs mesures n'améliorera pas la précision au delà du millimètre. En effet, la mesure donnera toujours le même résultat (ou bien alternera entre deux ou trois résultats si l'opérateur à la main peu sure), et l'écart type $\sigma_\text{exp}$ sera nul, et utiliser la formule $u(\bar{x}) = \sigma_\text{exp}/\sqrt{N}$ avec $N$ grand donne une incertitude non réaliste. En somme, avec ce matériel de mesure, l'erreur n'est pas aléatoire et ne se prête pas à un traitement statistique. On a alors plutôt $\Delta x = \Delta x_\text{type~B}$.

Second exemple, moins trivial : on mesure le temps de chute d'une bille dans une colonne de glycérol, en chronométrant le temps de passage entre deux graduations marquées sur la colonne. Il y a une erreur aléatoire due au temps de réaction de l'expérimentateur qui démarre et arrête le chronomètre, ainsi qu'une erreur aléatoire due aux conditions initiales (les conditions de lâcher de la bille). À ceci s'ajoute une erreur non aléatoire, celle de la distance $d$ entre les deux graduations qui est toujours la même. Répéter les mesures et les traiter de façon statistique permet de réduire les deux erreurs aléatoires, mais pas celle sur la distance $d$. Par exemple si $d$ est connue à 10cm près, on voit bien que cette incertitude va dominer l'erreur et qu'on ne pourra pas la réduire en répétant les mesures. La méthode générale est donc d'estimer l'incertitude de type A, $\Delta x_\text{type~A}$, pour une série de mesures, l'incertitude de type B, $\Delta x_\text{type~B}$, pour une seule mesure, et d'en déduire l'incertitude globale :

\begin{equation} \delta x = \sqrt{\delta x_\text{type~A}^2 + \delta x_\text{type~B}^2}. \end{equation}



Des formules

Soit une loi $p(x)$.

On a $\displaystyle \int_{-\infty}^{+\infty} p(x)\text{d} x = 1$.

Valeur moyenne (ou espérance) de la loi : \begin{equation*} \bar{x} = \int_{-\infty}^{+\infty} x\, p(x)\text{d} x. \end{equation*}

Écart-type de la loi : \begin{equation*} u(x) = \sqrt{\int_{-\infty}^{+\infty} p(x) (x-\bar{x})^2 \text{d} x}. \end{equation*}

$\Delta x_\alpha$ est tel que $\displaystyle\int_{\bar{x}-\Delta x_\alpha}^{\bar{x}+\Delta x_\alpha} p(x)\text{d} x = \alpha$.



  Site version 02/2018.