8.1 Variabilité de la variance
L’idée de la crédibilité linéaire de Bühlmann était de pouvoir exprimer la prime prédictive des modèles bayésiens sous une forme linéaire, de sorte à avoir:
\[p_{T+1} = \mathsf{Z} \overline{S} + (1-\mathsf{Z}) E[\mu(\Theta)].\]
avec:
\[\mathsf{Z} = \frac{T}{K + T}, \text{ où } K = \frac{\Sigma^2}{M^2} = \frac{E[\sigma^2(\theta_i)]}{Var[\mu(\Theta)]}\]
Tous les modèles bayésiens ne peuvent être adéquatement approximés par cette approche car une troisième condition avait aussi été énoncée:
- La variance de la variable aléatoire \(S_t|\Theta=\theta\) est constante pour tous \(t=1,...,T\).
Comme nous le verrons dans ce chapitre, plusieurs applications pratiques correspondent à cette situation.
Exemple 8.1 Supposons que nous évaluons 2 groupes d’assurés en assurance collective:
Le groupe \(A\) contient 3 véhicules, et chaque véhicule du groupe est affecté par la même hétérogénéité \(\theta_A\);
Le groupe \(B\) contient 2 véhicules, affectés par la même hétérogénéité \(\theta_B\).
On considère un groupe comme un assuré, et on veut estimer les primes de crédibilité de chaque groupe. Trouvez l’espérance et la variance conditionnelles de chaque groupe.
(Exemple à faire en classe)
L’idée de normaliser et d’introduire un poids, qu’on notera \(W_{i,t}\) (pour le \(t^e\) contrat de l’assuré \(i\)), dans le modèle est de pouvoir comparer l’expérience de sinistres de différents assurés afin qu’ils soient du même ordre de grandeur. Dans notre exemple, puisqu’il y avait 3 individus dans le groupe \(A\), il est normal de s’attendre à ce qu’il ait plus de réclamations que le groupe B.
En normalisant la variable aléatoire \(S_A\) et \(S_B\) par le nombre d’individus dans le groupe, nous avons vu que les deux nouvelles variables aléatoires \(Y_A\) et \(Y_B\) ont maintenant la même prime de risque. Par contre, ils n’ont pas la même variance conditionnelle.
La crédibilité de Bühlmann proposait une manière d’approximer les modèles de crédibilité bayésienne. Le modèle de Bühlmann-Straub a le même objectif: approximer les modèles de crédibilité bayésienne dans lesquels il y a maintenant une pondération pour chaque observation.
Plus précisément, dans le modèle de Bühlmann:
Les sinistralités des contrats annuels de tous les assurés sont comparables;
Pour un seul assuré, la sinistralité de ses contrats passés ont tous le même poids dans le calcul de la prime future.
Le modèle de Bühlmann-Straub a l’objectif de généraliser ces hypothèses.
La taille, ou le poids \(W\) d’un assuré ou d’une police peut représenter plusieurs éléments:
Le nombre de véhicules assurés, comme pour le dernier exemple;
Le nombre de personnes assurées, comme pour un employeur qui aurait plusieurs employés, ou encore une ferme ayant plusieurs structures à assurer;
La prime a priori calculée en fonction des caractéristiques du risque de l’assuré.
8.1.1 Hypothèses du modèle
Plus généralement, nous aurons:
Un portefeuille de \(m\) assurés (\(i=1,2,...,m\)) dont l’expérience a été observée pendant \(T\) périodes (\(t=1,...,T\));
Les \(\Theta\) pour \(i=1,\ldots,m\), représentant l’hétérogénéité d’un assuré \(i\), sont indépendants et identiquement distribués;
Les variables aléatoires conditionnelles \(S_{i,t}|\Theta = \theta\) représentant la sinistralité de l’assuré \(i\), au contrat \(t\), sont indépendantes pour \(t=1,...,T\) et \(i=1,\ldots, m\);
Une sinistralité normalisée pour le \(t^e\) contrat de l’assuré \(i\) est introduite. Elle correspond à:
\[Y_{i,t} = \frac{S_{i,t}}{W_{i,t}}\]
On ne travaillera plus directement avec la sinistralité \(S_{i,t}\), mais avec une sinistralité normalisée \(Y_{i,t}\), et ce sera cette dernière qui sera crédibilisée.
Nous aurons ainsi:
- \(E[Y_{i,t}|\Theta] = \mu(\Theta)\), qui est constante dans le temps et ne dépend pas de \(t\). Ceci est causé par la normalisation de la sinistralité. C’est un résultat important dans le modèle car nous avons l’égalité suivante:
\[E[Y_{i,1}|\Theta] = E[Y_{i,2}|\Theta] = \ldots = E[Y_{i,t}|\Theta] = \mu(\Theta)\]
- \(Var[Y_{i,t}|\Theta] = \frac{\sigma^2(\Theta)}{W_{i,t}}\). A l’inverse de l’espérance, la variance conditionnelle peut varier dans le temps, et à travers les assurés \(i\) tel que nous venons de le voir dans l’exemple précédent. Par contre, \(Var[Y_{i,t}|\Theta] \times W_{i,t} = \sigma^2(\Theta)\) sont comparables:
\[Var[Y_{i,1}|\Theta] \times W_{i,1} = Var[Y_{i,2}|\Theta] \times W_{i,2} = \ldots = Var[Y_{i,t}|\Theta] \times W_{i,t} = \sigma^2(\Theta)\]
Exemple 8.2 Reprenons l’exemple précédent des 2 groupes d’assurés en assurance collective.
Vérifiez que \(E[Y_{1}|\Theta] = E[Y_{2}|\Theta] = \mu(\Theta)\)
Vérifiez que \(Var[Y_{1}|\Theta] W_1 = Var[Y_{2}|\Theta] W_2 = \sigma^2(\Theta)\)
(Exemple à faire à la maison)
8.1.2 Notations
Nous utilisons toujours la notation suivante, similaire au modèle de crédibilité de Bühlmann:
\[\begin{eqnarray*} \mu &=& E[\mu(\Theta)] = E[E[Y_{i,t}|\Theta]]\\ \Sigma^2 &=& E[\sigma^2(\Theta)] = W_{i,t} E[Var[Y_{i,t}|\Theta]]\\ M^2 &=& Var[\mu(\Theta)] = Var[E[Y_{i,t}|\Theta]] \end{eqnarray*}\]
Notez encore une fois que nous travaillons sur la variable aléatoire normalisée \(Y_{i,t}\) et non sur \(S_{i,t}\).
Pour construire le modèle, nous avons besoin de généraliser la notation de certains termes. Nous avons ainsi:
\(\mathbf{Z}_i\), la crédibilité accordée à l’expérience de l’assuré \(i\);
\(W_{i,t}\), le poids accordé à l’assuré \(i\) pour sa période d’assurance \(t\);
\(S_{i,t}\), la sinistralité de l’assuré \(i\) pour sa période d’assurance \(t\);
\(W_{i,\bullet} = \sum_{t=1}^T W_{i,t}\), la somme des poids de l’assuré \(i\) pour toutes ses périodes d’assurance;
\(S_{i,\bullet} = \sum_{t=1}^T S_{i,t}\), la somme de la sinistralité de l’assuré \(i\) pour toutes ses périodes d’assurance;
\(Y_{i,t} = \tfrac{S_{i,t}}{W_{i,t}}\), la sinistralité normalisée de l’assuré \(i\) pour sa période d’assurance \(t\).
Pour le portefeuille en entier, nous introduisons aussi de nouvelles variables:
\[\begin{align*} \mathbf{Z}_{\bullet} &= \sum_{i=1}^m \mathbf{Z}_i\\ W_{\bullet,\bullet} &= \sum_{i=1}^m W_{i,\bullet} \end{align*}\]
Le modèle de Bühlmann cherchait à approximer la prime bayésienne de \(S_{i,T+1}\) par la forme linéaire
\[p_{i,T+1}^{(S)} = \mathsf{Z} \times \overline{S_{i}} + b\]
en se basant sur l’expérience de sinistre moyenne \(\overline{S_{i}}\).
Il ne fait pas de sens de travailler avec \(\overline{S_{i}}\) pour le modèle de Bühlmann-Straub car le modèle ne travaille plus directement avec \(S_{i,t}\), mais plutôt avec une sinistralité normalisée \(Y_{i,t}\).
Nous noterons ainsi la sinistralité moyenne pondérée comme:
\[Y_{i,W} = \frac{S_{i,\bullet}}{W_{i,\bullet}} = \frac{\sum_{t=1}^T S_{i,t}}{W_{i,\bullet}} = \frac{\sum_{t=1}^T W_{i,t} Y_{i,t}}{W_{i,\bullet}} = \sum_{t=1}^T \frac{W_{i,t}}{W_{i,\bullet}}Y_{i,t}\]
Nous noterons la sinistralité moyenne du portefeuille comme:
\[Y_{W,W} = \frac{\sum_{i=1}^m \sum_{t=1}^T S_{i,t}}{\sum_{i=1}^m W_{i,\bullet}} = \frac{\sum_{i=1}^m \sum_{t=1}^T W_{i,t} Y_{i,t}}{W_{\bullet,\bullet}} = \sum_{i=1}^m \sum_{t=1}^T \frac{W_{i,t}}{W_{\bullet,\bullet}}Y_{i,t} = \sum_{i=1}^m \frac{W_{i,\bullet}}{W_{\bullet,\bullet}}Y_{i,W}\]
La forme de la prime de crédibilité de Bühlmann-Straub est ainsi:
\[p_{i,T+1}^{(Y)} = \mathsf{Z}_i \times Y_{i,W} + b_i.\]
La prédiction linéaire est ainsi faite sur la sinistralité normalisée. Ainsi, pour résumer un élément important:
Le modèle de crédibilité de Bühlmann: la valeur \(p_{i,T+1}^{(S)}\) cherche à approximer la sinistralité \(S\),
Le modèle de crédibilité de Bühlmann-Straub: la valeur \(p_{i,T+1}^{(Y)}\) cherche à approximer la sinistralité normalisée \(Y\).
Proposition 8.1 Les paramètres \(\mathsf{Z_i}\) et \(b_i\) qui minimisent la fonction \(E[(p_{i, T+1}^{(Y)} - Y_{i, T+1})^2]\) sont:
\[\begin{eqnarray*} \mathsf{Z}_i &=& \frac{Cov[Y_{i,W}, Y_{i, T+1}]}{Var[Y_{i,W}]}, \ \text{ et } \ b = (1-\mathsf{Z}_i) \mu \end{eqnarray*}\]
et la prime \(p_{i,T+1}\) s’exprime comme:
\[p_{i,T+1}^{(Y)} = \mathsf{Z}_i \times Y_{i,W} + (1-\mathsf{Z}_i) \mu \]
(Développement à faire en classe)
Proposition 8.2 Puisque \(p_{i,T+1}^{(Y)}\) approxime la sinistralité future normalisée, l’approximation de la sinistralité future \(S_{i,T+1}\) du modèle de Bühlmann-Straub, notée \(p_{i,T+1}^{(S)}\), correspond à la prime de crédibilité normalisée multipliée par le poids de l’assuré \(i\) au temps \(T+1\):
\[p_{i,T+1}^{(S)} = p_{i,T+1}^{(Y)} \times W_{i,T+1}\]
8.1.3 Paramètres de structure
Proposition 8.3 La covariance entre la moyenne pondérée de la sinistralité normalisée et la prime de risque s’exprime comme:
\[Cov[Y_{i,W}, Y_{i, T+1}] = Var\left[\mu(\Theta) \right] = M^2\]
(Développement à faire en classe)
Proposition 8.4 La variance de la moyenne pondérée de la sinistralité normalisée s’exprime comme:
\[Var[Y_{i,W}] = \frac{1}{W_{i \bullet}} \Sigma^2 + M^2 \]
(Développement à faire en classe)
Proposition 8.5 Le facteur de crédibilité pour la \(i^e\) police est:
\[\begin{eqnarray*} \mathbf{Z}_i &=& \frac{Cov[Y_{i,W}, \mu(\Theta)]}{Var[Y_{i,W}]}\\ &=& \frac{M^2}{\frac{1}{W_{i \bullet}} \Sigma^2 + M^2} \\ &=& \frac{W_{i \bullet}}{W_{i \bullet} + K} \text{ où } K = \frac{\Sigma^2}{M^2} \end{eqnarray*}\]
Proposition 8.6 Le modèle de Bühlmann-Straub est équivalent au modèle de Bühlmann si \(W_{i,t} =1\) pour tous les contrats \(t\) de tous les assurés \(i\).
(Exemple à faire en classe)
Étant donné que l’approche de Bühlmann-Straub n’est qu’une généralisation de la crédibilité de Bühlmann, plusieurs des analyses que nous avons déjà faites tiennent encore. Par exemple, l’analyse du coefficient de crédibilité, en fonction de \(\Sigma^2\) et \(M^2\) est la même. Par contre, au lieu d’analyser le comportement du coefficient \(\mathbf{Z}\) en fonction de \(T\) comme dans le modèle de Bühlmann, on l’analysera en fonction de \(W_{\bullet}\).
Exemple 6.1 On suppose que le coût total des réclamations annuelles d’un groupe pour son contrat \(t\) suit une loi normale de moyenne \(n_t \times \Theta\) et de variance \(n_t \times 15,000^2\), où \(n_t\) est le nombre de véhicules dans le groupe. Formellement, nous avons ainsi :
\[S_{t} |\Theta = \theta \sim Normal(n_t \times \theta, n_t \times 15,000^2).\]
Les actuaires pensent qu’il existe 3 types d’assurés dans le portefeuille:
\[\begin{eqnarray*} \Pr(\Theta = \theta) = \begin{cases} 0.2, \ \text{pour } \theta=750\\ 0.3, \ \text{pour } \theta=1250\\ 0.5, \ \text{pour } \theta=1800\\ \end{cases}, \end{eqnarray*}\]
Un assuré a été observé pendant 3 contrats annuels, et cherche à s’assurer pour une 4e année. Les sinistres réclamés et le nombre de véhicules \(n_t\) pour les années \(t=1,2,3,4\) sont:
Année (\(t\)) | \(n_t\) | \(s_t\) |
---|---|---|
\(1\) | \(100\) | \(120,000\) |
\(2\) | \(120\) | \(93,000\) |
\(3\) | \(75\) | \(99,000\) |
\(4\) | \(120\) | ? |
A l’aide de l’approche de Bühlmann-Straub, répondez aux questions suivantes:
- Calculez la prime a priori de ce groupe au temps \(t=4\);
- Calculez la valeur du coefficient \(\mathsf{Z}\) au temps \(T=4\);
- Trouvez la prime de crédibilité du modèle de Bühlmann-Straub pour l’année 4;
- Comparez les résultats obtenus avec un calcul bayésien.
(Exemple à faire en classe)
8.1.4 Estimateurs des paramètres de structures
Proposition 8.7 Les estimateurs suivants de \(\mu, \Sigma^2\) et \(M^2\) sont sans biais:
\[\begin{eqnarray*} \hat{\mu} &=& \sum_i^m \frac{W_{i, \bullet}}{W_{\bullet, \bullet}} Y_{i, W} = Y_{W, W} \\ \widehat{\Sigma^2} &=& \frac{1}{m (T-1)} \sum_{i=1}^{m} \sum_{t=1}^{T} W_{i,t}(Y_{i,t} - Y_{i,W})^2 \\ \widehat{M^2} &=& \frac{W_{\bullet, \bullet}}{W_{\bullet, \bullet}^2 - \sum_i^m W_{i, \bullet}^2} \left( \sum_{i=1}^{m} W_{i, \bullet} (Y_{i, W} - Y_{W,W})^2 - (m-1) \widehat{\Sigma^2} \right) \end{eqnarray*}\]
Solution
La preuve se fait facilement en suivant les mêmes étapes que pour le modèle de Bühlmann.Exemple 8.3 Calculez les primes de crédibilité pour la 4e année des deux groupes dont l’expérience est décrite dans le tableau suivant:
Groupe | Statistique | An 1 | An 2 | An 3 | An 4 |
---|---|---|---|---|---|
1 | Montant des réclamations | 8000 | 11,000 | 15,000 | . |
Taille du groupe | 40 | 50 | 70 | 75 | |
2 | Montant des réclamations | 20,000 | 24,000 | 19,000 | . |
Taille du groupe | 100 | 120 | 115 | 95 |
(Développement à faire en classe)
8.1.4.1 Base de données non-équilibrée
Dans le chapitre sur le modèle de Bühlmann, nous avions vu qu’une base de données équilibrée correspondait à la situation où tous les assurés \(i=1,\ldots,m\) sont observés pendant le même nombre de contrats. Dans la table ci-dessous, on observait tous les \(m\) assurés pendant \(T\) contrats.
Assuré | Contrat 1 | Contrat 2 | … | Contrat T |
---|---|---|---|---|
1 | \(s_{1,1}\) | \(s_{1,2}\) | … | \(s_{1,T}\) |
2 | \(s_{2,1}\) | \(s_{2,2}\) | … | \(s_{2,T}\) |
… | … | … | … | … |
\(m\) | \(s_{m,1}\) | \(s_{m,2}\) | … | \(s_{m,T}\) |
En pratique, les données des assureurs ne sont pas équilibrées.
Proposition 8.8 Dans le cas de données non-équilibrées, les estimateurs \(\hat{\mu}\) et \(\widehat{M^2}\) restent les mêmes, mais l’estimateur de \(\sigma^2\) s’exprime comme:
\[\widehat{\Sigma^2} = \frac{1}{\sum_{i=1}^{m} (T_i - 1)} \sum_{i=1}^{m} \sum_{t=1}^{T} W_{i,t}(Y_{i,t} - Y_{i, W})^2\]
Exemple 8.4 Calculez les primes de crédibilité pour l’année \(2016\) des deux flottes de véhicules suivantes, dont l’expérience est décrite ici:
Flotte | Statistique | 2015 | 2014 | 2013 | 2012 |
---|---|---|---|---|---|
1 | Nombre de sinistres | 3 | 2 | 2 | 0 |
Nombre de véhicules | 2 | 2 | 2 | 1 | |
2 | Nombre de sinistres | 2 | 1 | 0 | . |
Nombre de véhicules | 4 | 3 | 2 | . |