5.2 Temps d’attente
Nous avons déjà vu que la Poisson construite à partir de temps d’attente exponentiel entre les événements. Il est possible de choisir d’autres distributions du temps d’attente, afin de créer une dépendence de duration.
5.2.1 Gamma
On peut choisir la distribution gamma comme temps d’attente entre les événements:
\[f(\tau; \alpha, \lambda) = \frac{\lambda^{\alpha}}{\Gamma(\alpha)} \tau^{\alpha-1} e^{-\lambda \tau}.\]
La gamma distribution a une moyenne égale à \(\tfrac{\alpha}{\lambda}\) et une variance égale à \(\tfrac{\alpha}{\lambda^2}\). La distribution gamma est une distribution exponentielle pour \(\alpha=1\).
On peut construire une nouvelle distributon de comptage comme lorsque nous avions construit la loi de Poisson.
On cherche le temps d’arrivée du \(k^{e}\) événement, de manière à avoir \(\nu(k) = \sum_{i=1}^k \tau_i\). On peut montrer qu’une somme de variables aléatoires gamma sera aussi une gamma, ce qui signifie que \(\nu(k)\) est encore une gamma. Sa fonction de densité s’exprime comme:
\[\begin{equation*} f(\nu; \alpha, \lambda) = \frac{\lambda^{k \alpha}}{\Gamma(k \alpha)} \nu^{k\alpha-1} e^{-\lambda \nu} \end{equation*}\]
et sa fonction cumulative de \(\nu(k)\) s’exprime comme:
\[\begin{eqnarray*} F_k(t) &=& \frac{1}{\Gamma(k \alpha)} \int_0^{t} \lambda^{k \alpha} \nu^{k\alpha-1} e^{-\lambda \nu} d\nu = G(\alpha k, \lambda t). \end{eqnarray*}\]
Cette dernière équation représente la fonction gamma incomplète.
À partir de ces derniers résultats, on peut donc exprimer la fonction de probabilité d’une nouvelle distribution de comptage appelée la Gamma count distribution ou simplement GCD:
\[P(N(t) = k) = G(\alpha k, \lambda t) - G(\alpha k + \alpha, \lambda t), \ \ \ \text{ avec } \ \ G(0,\alpha \lambda) = 1 \] En pratique, tel que nous le verrons, on peut utiliser des fonctions préprogrammées pour calculer la fonction gamma incomplète \(G(\alpha k, \lambda t)\) et \(G(\alpha k + \alpha, \lambda t)\).
5.2.1.1 Quelques propriétés de la GCD
La distribution GCD généralise la distribution de Poisson, car une GCD ayant un paramètre \(\alpha = 1\) sera une loi de Poisson, En effet, \(\alpha = 1\) signifie un temps d’attente exponentiel entre les événements, et nous savons que cela implique une loi de Poisson pour le nombre d’événements.
Pour d’autres valeur entières de \(\alpha > 1\), la GCD se nomme la distribution Erlang de comptage. La fonction de probabilité de la distribution Erlang de comptage s’exprime comme:
\[P(N(t) = k) = e^{-\lambda t} \sum_{j=0}^{\alpha-1} \frac{(\lambda t)^{\alpha k + j}}{(\alpha k + j) !}\]
Pour l’analyse du nombre de réclamations, la fonction de hasard mesure le taux d’accident instannée à travers le temps. La fonction de hasard d’un temps d’attente s’exprime comme:
\[\begin{equation*} \gamma(t) = \frac{f(t)}{1-F(t)} \label{hazard} \end{equation*}\]
où \(f(t)\) et \(F(t)\) sont la fonction de densité et la fonction cumulative du temps d’attente entre deux événements.
Si la fonction de hasard est monotonique, une dépendance de duration négative est présente pour \(\frac{d \gamma(t)}{dt} < 0\) et une dépendance positive est possible pour \(\frac{d \gamma(t)}{dt} > 0\).
Proposition 5.2 La fonction de hazard sous-jacente à la loi de Poisson est égal à:
\[\begin{eqnarray*} \gamma(t) &=& \frac{f(t)}{1-F(t)} \nonumber \\ &=& \lambda e^{-\lambda t}/(1 - (1- e^{-\lambda t})) \nonumber \\ &=& \lambda \end{eqnarray*}\]
On peut voir que la fonction de hazard est constante pour la Poisson, signifiant que le temps depuis le dernier incident n’affecte pas la probabilité de survenance.
Proposition 5.3 La fonction de hasard de la GCD est égal à:
\[\begin{equation*} \frac{1}{\gamma(t)} = \int_0^{\infty} e^{-\lambda u} \left(1 + \frac{u}{\tau} \right)^{\alpha - 1} du \end{equation*}\]
Après analyse, on pourrait voir que la fonction de hazard est croissante pour \(\alpha >1\), constante pour \(\alpha=1\) et décroissante pour \(\alpha < 1\).
Ainsi, pour \(\alpha \ne 1\), la GCD suppose de la dépendance de duration puisque la probabilité d’avoir un événement dépendra du temps depuis le dernier événement.
Proposition 5.4 L’espérance et la variance d’une GCD ne peuvent pas être exprimées sous forme fermée. Toutefois, on peut exprimer ces moments comme:
\[\begin{eqnarray*} E[S_i(t_i)] &=& \sum_{j=1}^{\infty} G(\alpha j, \lambda_i t_i) \\ Var[S_i(t_i)] &=& E[S_i(t_i)^2] - E[S_i(t_i)]^2 \nonumber \\ &=& \sum_{j=1}^{\infty} j^2 P(N(t_i) = j) - \left(\sum_{j=1}^{\infty} G(\alpha j, \lambda_i t_i)\right)^2 \end{eqnarray*}\]
Pour conclure, il faut bien comprendre que l’estimation de la loi sous-jacente du temps d’attente entre deux réclamations s’effectue en n’utilisant que le nombre de réclamations observés. Un peu comme dans la db que nous utilons pour le cours, le temps d’attente entre les sinistres n’est pas observé. Malgré tout, en inférant sur le nombre de réclamations, nous serons capables de déduire certaines propriétés du temps d’attente.
5.2.2 Poisson modifiée
Le temps exponentiel entre deux événements nous montre que le nombre d’événement dans l’intervalle \((0,T)\) suit une loi de Poisson de paramètre \(\lambda_i t\). Un même assuré exposé au risque pendant une période deux fois plus longue aura un paramètre de moyenne deux fois plus grand.
Ainsi, avec des régresseurs, on peut exprimer le paramètre de moyenne de la Poisson comme:
\[\exp(X_i' \beta + \ln(t))\]
Dans ce cas, \(t\) est souvent référé comme un offset logarithmique.
Au lieu d’un temps d’attente gamma, il aurait été possible de construire une distribution de comptage avec un temps d’attente Weibull, ce qu’on nomme une Weibull Count Distribution ou WCD. Dans une telle situation, on aurait remarqué que le paramètre de la WCD est de forme \(\lambda_i t^c\), ce qui signifie ainsi:
\[\exp(X_i' \beta + c \ln(t))\]
Par analogie, au lieu d’utiliser une WCD ou une GCD, un moyen rapide de tester la présence de contagion de duration est possible d’utiliser une Poisson de moyenne \(\exp(X_i' \beta + c \ln(t))\) et de vérifier si \(c\) est statistiquement différent de 1.