1.1 Segmentation des risques
(Rappel) L’une des grandes caractéristiques de l’assurance est que tous les individus ne sont pas égaux devant le risque. Certains assurés sont en effet plus dangereux que d’autres. Ainsi, au-delà de déterminer le juste prix du risque à chaque assuré, la segmentation des risques implique aussi ce qui est désormais appelé la guerre de l’antisélection.
Exemple 1.1 Supposons un cas simple d’une assurance pour vol pour de baggages, où nous supposons les éléments suivants:
- Nous travaillons avec deux types d’assurés \(A\) et \(B\);
- Nous avons le même nombre d’assurés de chaque type: \(n_A = n_B\);
- Les distributions de perte suivantes:
\[\begin{equation*} S_A = \begin{cases} 0 & \text{avec probabilité de } 90 \%\\ 250 & \text{avec probabilité de } 10 \%\\ \end{cases}, \end{equation*}\]
\[\begin{equation*} S_B = \begin{cases} 0 & \text{avec probabilité de } 80 \%\\ 250 & \text{avec probabilité de } 20 \%\\ \end{cases}, \end{equation*}\]
Calculez la prime pure pour le cas où:
- L’actuaire est au courant des différences entre les risques;
- L’actuaire n’est pas au courant des différences entre les risques.
Solution
Nous pouvons faire quelues observations:
- Le portefeuille est composé de \(n_A + n_B\) individus;
- Les risques ne sont donc pas identiquement distribués.
Deux situations sont à analyser:
1- L’actuaire est au courant de la différence entre les deux groupes. Ainsi, la prime pour chacun des groupes est:
\[\begin{eqnarray*} \text{Prime nette}_A = E[S_A] &=& 25 \\ \text{Prime nette}_B = E[S_B] &=& 50 \end{eqnarray*}\]
2- L’actuaire n’est pas au courant de la différence entre les deux groupes. Ainsi, pour lui, tous les assurés sont similaires. Il propose donc la même prime aux deux groupes d’assurés. Plus précisément, il voit la sinistralité de son portefeuille comme:
\[\begin{equation*} S_{AB} = \begin{cases} 0 & \text{avec probabilité de } 85 \%\\ 250 & \text{avec probabilité de } 15 \%\\ \end{cases}, \end{equation*}\]
Ainsi, la prime calculée est:
\[\begin{eqnarray*} \text{Prime nette}_{AB} = E[S_{AB}] = 37.50 \end{eqnarray*}\]
Exemple 1.2 Pour la compagnie d’assurance # 2 du deuxième actuaire, quelles seront les conséquences de l’hétérogénéité de ce portefeuille si une autre compagnie d’assurance, la compagnie # 1 du premier actuaire, arrive dans le marché et tarifie correctement selon le groupe?
Solution
Si on suppose que le comportement des assurés ne se base que sur le montant de la prime, en excluant toutes les autres considérations de service à la clientèle, les assurés iront toujours vers l’assureur offrant la prime la plus basse:
- Les membres du groupe A iront s’assurer dans la compagnie d’assurance # 1 car la prime proposée est de \(25\), au lieu de \(37.50\).
- Les membres du groupe B resteront dans l’assureur # 2 car la prime qu’ils ont est de \(37.50\), au lieu d’une prime de \(50\) proposée par l’assureur # 1.
En conséquence, l’assureur #1 attirera tous les membres du groupe B, et l’assureur #2 aura tous les assurés du groupe A.
L’assureur #2 ne tarifie pas selon le risque réel, et aura des pertes de:
\[\begin{eqnarray*} \text{perte} &=& \text{sinistres à payer} - \text{primes à recevoir}\\ &=& n_B \times 50 - n_B \times 37.50 \\ &=& n_B \times 12.50 \end{eqnarray*}\]
L’assureur #1, quant à lui, tarifie selon le risque réel car la prime offerte aux assurés du groupe A correspond à la perte moyenne des membres de ce groupe, soit \(25\).
En conclusion:
- Les résultats technique de la seconde compagnie seront équilibrés;
- La première compagnie subira de fortes pertes.
Dès qu’un assureur introduit une nouvelle variable efficace et pertinente dans sa tarification, les compétiteurs n’utilisant pas cette nouvelle variable vont nécessairement subir des pertes. Nous constatons ainsi ce que nous appelons une spirale de segmentation.
Les modèles de tarification avancés incluent des covariables afin de tarifier en fonction des caractéristiques de l’assuré. Dans le cours ACT2060, des modèles de biais minimums ont été introduits. Dans des cours plus avancés ou même à la maitrise, des approches de type GLM (Generalized Linear Models) ou GLMM (Generalized Linear Mixed Models) sont utilisés.
Dans ces situations, des relativités sont intégrées dans la structure de tarification de l’assureur.
Exemple 1.3 On suppose qu’une compagnie d’assurance segmente son portefeuille en se basant sur 3 caractéristiques du risque, soit l’âge de l’assuré, le sexe de l’assuré et son territoire. En utilisant un modèle de tarification basé sur la théorie des GLM, la prime de base générée est de \(500\$\), et les relativités obtenues sont:
\[\begin{align*} r_{sexe} &= \begin{cases} 1.00 & \text{si l'assuré est un homme }\\ 1.50 & \text{sinon} \\ \end{cases}\\ r_{age} &= \begin{cases} 2.00 & \text{si l'assuré a moins de 30 ans }\\ 1.20 & \text{si l'assuré a entre 30 et 45 ans }\\ 1.00 & \text{sinon} \\ \end{cases}\\ r_{terr} &= \begin{cases} 1.60 & \text{si l'assuré vit dans la région de Montréal }\\ 1.10 & \text{si l'assuré vit dans la région de Québec }\\ 0.75 & \text{si l'assuré vit en Gaspésie }\\ 1.00 & \text{sinon} \\ \end{cases} \end{align*}\]
Calculez les différentes primes possibles en fonction des caractéristiques de l’assuré.
(Exemple à faire en classe)
Le dernier exemple utilisait 3 variables de segmentation actuellement utilisées en tarification, mais fortement susceptibles d’être interdites en assurance dans les prochaines années.
Les deux derniers modèles de crédibilité que nous avons vus, soit la crédibilité bayésienne de base, et le modèle de crédibilité de Bühlmann, ne sont pas tout-à-fait adaptés à l’utilisation de variables de segmentation. Il faut généraliser ces deux approches.
Au lieu de supposer que le profil de risque inconnu d’un assuré, habituellement modélisé par la variable aléatoire \(\Theta\), corresponde au paramètre de la distribution conditionnelle, on pourrait utiliser \(\Theta\) comme un bruit autour du paramètre.
1.1.1 Poisson-gamma: NB2
Supposons maintenant que nous avons \(S_t|\Theta = \theta \sim Poisson(\lambda_t \theta)\), avec \(\Theta \sim gamma(\alpha, \tau)\). Nous aurions ainsi la fonction de probabilité et la fonction de densité suivante:
\[ \underbrace{\Pr[S_t=s_t|\Theta=\theta] = \frac{(\lambda_t \theta)^{s_t} e^{-\lambda_t \theta}}{s_t!}}_{\text{Distribution conditionnelle}} \text{ pour } s_t \in \mathbb{N}\]
\[ \underbrace{f(\theta) = \frac{\tau^{\alpha}}{\Gamma(\alpha)} \theta^{\alpha - 1} e^{-\tau \theta}}_{\text{Distribution a priori}}, \text{ pour } \theta > 0, \text{ et } \alpha > 0, \tau >0.\]
Ce modèle est différent de celui que nous avions étudié au chapitre sur la crédibilité bayésienne. Ce n’est pas le paramètre \(\lambda_t\) qui est aléatoire, mais un facteur multiplicatif \(\Theta\).
Exercice 1.1 Calculez la prime de risque et la prime collective de ce modèle.
(Exercice à faire en classe)
Puisque nous supposons maintenant que l’hétérogénéité \(\Theta\) est un bruit autour de la moyenne \(\lambda_t\), mais aussi pour des raisons computationnelles que nous ne couvrirons pas dans ce cours, nous paramétriserons la distribution de \(\Theta\) de manière à ce que \(E[\Theta] = 1\). Ainsi, le modèle Poisson-gamma s’exprime plutôt comme \(S_t|\Theta = \theta \sim Poisson(\lambda_t \theta)\), avec \(\Theta \sim gamma(\alpha, \alpha)\)
\[\begin{align*} {\Pr[S_t=s_t|\Theta=\theta] = \frac{(\lambda_t \theta)^{s_t} e^{-\lambda_t \theta}}{s_t!}} \text{ pour } s_t \in \mathbb{N}\\ {f(\theta) = \frac{\alpha^{\alpha}}{\Gamma(\alpha)} \theta^{\alpha - 1} e^{-\alpha \theta}}, \text{ pour } \theta > 0, \text{ et } \alpha > 0, \tau >0. \end{align*}\]
Exercice 1.2 Calculez \(E[N_t]\) et \(Var[N_t]\) pour ce modèle.
(Exercice à faire en classe)
La variable aléatoire \(\Theta\) modélise le niveau de risque inconnu. Puisque \(E[\Theta] = 1\), on peut voir qu’un assuré ayant un \(\theta < 1\) réclamera moins que la moyenne du portefeuille, alors qu’un assuré ayant un \(\theta > 1\) est un assuré qui réclamera davantage.
Une manière intuitive de comprendre cette forme d’hétérogénéité est d’y voir un paramètre englobant toutes les caractéristiques de l’assuré qui ne sont pas prises en compte dans la classification:
parce qu’il n’est pas permis de les utiliser: âge, sexe, religion, territoire, etc.
parce qu’il est impossible de les mesurer: maturité, qualité des réflexes, aggressivité ou colère au volant ou propension à prendre de l’alcool en conduisant pour l’assurance automobile, etc.
Exercice 1.3 Pour le modèle \(S_t|\Theta = \theta \sim Poisson(\lambda_t \theta)\), avec \(\Theta \sim gamma(\alpha, \alpha)\), trouvez les distributions et les primes suivantes:
- La distribution marginale de \(S_{t}\);
- La distribution a posteriori de \(\Theta\), sachant \(S_{1}=s_{1}, \ldots,S_{T}=s_{T}\);
- La distribution prédictive de \(S_{T+1}\), sachant \(S_{1}=s_{1}, \ldots ,S_{T}=s_{T}\).
- La prime de risque;
- La prime collective;
- La prime prédictive au temps \(t=T\);
- La prime chargée à un nouvel assuré;
- Le coefficient de crédibilité \(\mathsf{Z}\) pour la prime de crédibilité.
(Exercice à faire en classe)
Nous pouvons faire quelques observations sur ce nouveau modèle de tarification:
Un nouvel assuré est tarifé à une prime \(\lambda_t\), qui inclut des composantes de segmentation;
La prime prédictive est basée sur le nombre de réclamations passés, mais aussi sur les valeurs de \(\lambda_t\) passées;
Un assuré aura une augmentation de prime si \(\sum_{t=1}^T s_t > \sum_{t=1}^T \lambda_t\), c’est-à-dire s’il réclame davantage de sinistres que ce à quoi l’assureur s’attendait;
Il n’y a pas de pondération temporelle des sinistres: un sinistre réclamé il y a 10 ans a autant de poids dans le calcul de la prime future qu’un sinistre réclamé l’an passé.
En assurance non-vie, ce dernier modèle Poisson-gamma est très proche de ce qui est réellement utilisé en pratique. Par contre, comme nous l’avons vu dans le cours ACT2060, le passage entre le calcul d’une prime théorique (ici la prime pure) à la prime commerciale implique de nombreuses autres transformations:
Chargement de sécurité, taxe, profits, frais fixes et variables, etc.
Considérations de marketing, où l’augmentation et la diminution de la prime annuelle est souvent limitée pour garder un maximum de clients, etc.
Exercice 1.4 On suppose \(S_t|\Theta = \theta \sim Poisson(\lambda_t \theta)\) avec une hétérogénéité Gamma avec paramètre (\(\alpha = 2,\alpha = 2\)). Déterminez la prime prédictive au temps \(T=7\) de l’assuré s’il a eu les primes a priori et l’expérience de sinistre suivantes:
| Année | Prime a priori | Nb. de sin. |
|---|---|---|
| 1 | 0.150 | 0 |
| 2 | 0.175 | 1 |
| 3 | 0.250 | 0 |
| 4 | 0.250 | 4 |
| 5 | 0.100 | 0 |
| 6 | 0.122 | 1 |
| 7 | 0.144 | ? |
Avant de faire les calculs, il faut bien réaliser qu’un assuré paye la prime en début d’année, et subit des sinistres pendant l’année.
(Exercice à faire en classe)
Plusieurs des modèles bayésiens que nous avons vu dans le premier chapitre discutant de la crédibilité bayésienne peuvent être généralisés pour inclure une forme d’hétérogénéité multiplicative permettant d’inclure une segmentation du risque dans la structure de tarification d’un assureur.
Par contre, ce ne sont pas tous les modèles qui permettent une telle généralisation. Par exemple, le modèle Bernoulli-beta n’est pas si facilement généralisable.
1.1.2 Exponentiel-gamma
Nous avons étudié le couple de distributions conjuguées exponentiel-gamma. On pourrait généraliser l’approche, comme nous l’avons fait avec la NB2. Ainsi, nous aurions \(S_t|\Theta = \theta \sim Exponentiel\left(\frac{\theta}{\mu_t}\right)\), avec \(\Theta \sim gamma(\alpha, \tau)\).
Exercice 1.5 Trouvez la paramétrisation adéquate de la gamma afin que d’avoir une hétérogénéité multiplicative qui crée un bruit autour de la moyenne \(\mu_t\).
(Exercice à faire en classe)
Exercice 1.6 Pour le modèle \(S_t|\Theta = \theta \sim Exponentiel\left(\frac{\theta}{\mu_t}\right)\), avec \(\Theta \sim gamma(\alpha, \alpha - 1)\), montrez que:
- La distribution marginale de \(S_t\) est \(Lomax(\alpha, \mu_t(\alpha - 1))\), ou Pareto de type II, dont la fonction de densité de \(S_t\) s’exprime comme:
\[f_{S_t}(s_t) = \left(\frac{\mu_t(\alpha - 1)}{\mu_t(\alpha - 1) + s_t}\right)^{\alpha} \frac{\alpha}{\mu_t(\alpha - 1) + s_t}, \text{ pour } s_t > 0 \text{ et } \alpha > 1. \]
La distribution a posteriori de \(\Theta|S_1=s_1, \ldots, S_T = s_T\) est une gamma de paramètres: \(\alpha^* = \alpha + T\) et \(\tau^* = \alpha - 1 + \sum_{t=1}^T \frac{s_t}{\mu_t}\).
La distribution prédictive de \(S_{T+1}|S_1=s_1, \ldots, S_T = s_T\) est \(Lomax(\alpha^*, \mu_t \tau^*)\), pour \(s_t > 0\) et \(\alpha > 1, \tau > 0\).
(Exercice à faire à la maison)
Exercice 1.7 Trouvez la prime prédictive au temps \(t=T\).
(Exercice à faire en classe)
1.1.3 Crédibilité de Bühlmann-Straub
L’idée de la crédibilité linéaire de Bühlmann était de pouvoir exprimer la prime prédictive des modèles bayésiens sous une forme linéaire, de sorte à avoir:
\[p_{i,T+1} = \mathsf{Z} \overline{S} + (1-\mathsf{Z}) E[\mu(\Theta_i)].\]
Nous avons vu que pour lorsque la distribution conditionnelle est membre de la famille exponentielle linéaire, que la distribuiton de l’hétérogénité fait en sorte que nous ayons des distribution conjuguées, il y avait une manière élégante de calculer la valeur de \(\mathsf{Z}\), soit:
\[\begin{eqnarray*} \mathsf{Z} &=& \frac{T}{K + T}, \text{ où } K = \frac{\Sigma^2}{M^2} = \frac{E[\sigma^2(\theta_i)]}{Var[\mu(\theta_i)]} \end{eqnarray*}\]
On pourrait donc croire que les modèles avec hétérogénéité multiplicative que nous venons de voir pourraient aussi être estimés de manière exacte par l’approche de Bühlmann. Par contre, une troisième condition avait aussi été énoncée pour que cette approximation soit adéquate:
- La variance de la variable aléatoire \(S_t|\Theta=\theta\) est constante pour tous \(t=1,...,T\).
Dans le cas des modèles que nous venons de voir, cette condition n’est pas respectée.
Exercice 1.8 Calculez la variance de \(S_t\) pour le modèle Poisson-gamma: NB2.
(Exercice à faire en classe)
La crédibilité de Bühlmann proposait une manière d’approximer les modèles de crédibilité bayésienne. Le modèle de Bühlmann-Straub a le même objectif: approximer les modèles de crédibilité bayésienne dans lesquels il y a une pondération pour chaque observation.
Dans le modèle de Bühlmann,
- Les sinistralités des contrats annuels de tous les assurés sont tous comparables;
- Pour un seul assuré, la sinistralité de ses contrats passés ont tous le même poids dans le calcul de la prime future.
Le modèle de Bühlmann-Straub a l’objectif de généraliser ces hypothèses.
Exemple 1.4 Supposons que nous évaluons 2 groupes d’assurés en assurance collective:
- Le groupe \(A\) contient 3 individus, et chaque inidividu du groupe est affecté par la même hétérogénéité \(\theta_A\);
- le groupe \(B\) contient 2 indidivus, affectés par la même hétérogénéité \(\theta_B\).
On considère un groupe comme un assuré, et on veut estimer les primes de crédibilité de chaque groupe. Trouver l’espérance et la variance conditionnelles de chaque groupe.
(Exemple à faire en classe)
L’idée de normaliser et d’introduire un poids, qu’on notera \(W_{i,t}\), dans le modèle est de pouvoir comparer l’expérience de sinistres de différents assurés afin qu’ils soient du même ordre de grandeur. Dans notre exemple, puisqu’il y avait 3 inidivus dans le groupe \(A\), il est normal de s’attendre à ce qu’il ait plus de réclamations que le groupe B.
En normalisant la variable aléatoire \(S_A\) et \(S_B\) par le nombre d’individus dans le groupe, nous avons vu que les deux nouvelles variables aléatoires \(Y_A\) et \(Y_B\) ont maintenant la même prime de risque. Par contre, ils n’ont pas la même variance conditionnelle.
Dans le modèle de Bühlmann-Straub, nous verrons que la taille, ou le poids \(W\) d’un assuré ou d’une police peut représenter plusieurs éléments:
- Le nombre d’individus assurés, comme pour le dernier exemple, et en assurance collective;
- Le nombre de biens assurés, comme pour un assuré qui aurait une flotte de véhicule, ou encore une ferme ayant plusieurs structures à assurer;
- La prime a priori calculée en fonction des caractéristiques du risque de l’assuré.
1.1.4 Hypothèses du modèle
Ainsi, plus généralement, nous aurons:
Un portefeuille de \(m\) assurés (\(i=1,2,...,m\)) dont l’expérience a été observée pendant \(T\) périodes (\(t=1,...,T\));
Les \(\Theta\) pour \(i=1,\ldots,m\), représentant l’hétérogénéité d’un assuré \(i\), sont indépendants et identiquement distribués;
Les variables aléatoires conditionnelles \(S_{i,t}|\Theta = \theta\) représentant la sinistralité de l’assuré \(i\), au contrat \(t\), sont indépendantes pour \(t=1,...,T\) et \(i=1,\ldots, m\);
Une sinistralité normalisée est introduite. Elle correspond à:
\[Y_{i,T} = \frac{S_{i,t}}{W_{i,t}}\]
Il faut être attentif. On ne travaillera plus directement avec la sinistralité \(S_{i,t}\). Ce sera en effet la sinistralité normalisée \(Y_{i,T}\) qui sera crédibilisée.
Nous aurons ainsi:
- \(E[Y_{i,t}|\Theta] = \mu(\Theta)\), qui est constante dans le temps et ne dépend pas de \(t\). Ceci est causé par la normalisation de la sinistralité. C’est un résultat important dans le modèle car nous avons l’égalité suivante:
\[E[Y_{i,1}|\Theta] = E[Y_{i,2}|\Theta] = \ldots = E[Y_{i,t}|\Theta] = \mu(\Theta)\]
- \(Var[Y_{i,t}|\Theta] = \frac{\sigma^2(\Theta)}{W_{i,t}}\). A l’inverse de l’espérance, la variance conditionnelle peut varier dans le temps, et à travers les assurés \(i\) tel que nous venons de le voir dans l’exemple précédent. Par contre, \(Var[Y_{i,t}|\Theta] \times W_{i,t} = \sigma^2(\Theta)\) sont comparables:
\[Var[Y_{i,1}|\Theta] \times W_{i,1} = Var[Y_{i,2}|\Theta] \times W_{i,2} = \ldots = Var[Y_{i,t}|\Theta] \times W_{i,t} = \sigma^2(\Theta)\]
Exemple 1.5 Reprendre l’exemple précédent des 2 groupes d’assurés en assurance collective.
Vérifiez que \(E[Y_{1}|\Theta] = E[Y_{2}|\Theta] = \mu(\Theta)\)
Vérifiez que \(Var[Y_{1}|\Theta] W_1 = Var[Y_{2}|\Theta] W_2 = \sigma^2(\Theta)\)
(Exemple à faire à la maison)
1.1.5 Notations
Nous utilisons toujours la notation suivante, similaire au modèle de crédibilité de Bühlmann:
\[\begin{eqnarray*} \mu &=& E[\mu(\Theta)] = E[E[Y_{i,t}|\Theta]]\\ \Sigma^2 &=& E[\sigma^2(\Theta)] = E[Var[Y_{i,t}|\Theta]]\\ M^2 &=& Var[\mu(\Theta)] = Var[E[Y_{i,t}|\Theta]] \end{eqnarray*}\]
Notez encore une fois que nous travaillons sur la variable aléatoire normalisée \(Y_{i,t}\) et non sur \(S_{i,t}\).
Pour construire le modèle, nous avons besoin de généraliser la notation de certains termes. Nous avons ainsi:
- \(\mathbf{Z}_i\), la crédibilité accordée à l’expérience de l’assuré \(i\);
- \(W_{i,t}\), le poids accordé à l’assuré \(i\) pour sa période d’assurance \(t\);
- \(S_{i,t}\), la sinistralité de l’assuré \(i\) pour sa période d’assurance \(t\);
- \(W_{i,\bullet} = \sum_{t=1}^T W_{i,t}\), la somme des poids de l’assuré \(i\) pour toutes ses périodes d’assurance;
- \(S_{i,\bullet} = \sum_{t=1}^T S_{i,t}\), la somme de la sinistralité de l’assuré \(i\) pour toutes ses périodes d’assurance;
- \(Y_{i,t} = \tfrac{S_{i,t}}{W_{i,t}}\), la sinistralité normalisée de l’assuré \(i\) pour sa période d’assurance \(t\).
Pour le portefeuille en entier, nous introduisons aussi de nouvelles variables:
\[\begin{align*} \mathbf{Z}_{\bullet} &= \sum_{i=1}^m \mathbf{Z}_i\\ W_{\bullet,\bullet} &= \sum_{i=1}^m W_{i,\bullet} \end{align*}\]
Le modèle de Bühlmann cherchait à approximer la prime bayésienne de \(S_{i,T+1}\) par la forme linéaire
\[p_{i,T+1}^{(S)} = \mathsf{Z} \times \overline{S_{i}} + b\]
en se basant sur l’expérience de sinistre moyenne \(\overline{S_{i}}\).
Il ne fait pas de sens de travailler avec \(\overline{S_{i}}\) pour le modèle de Bühlmann-Straub car le modèle ne travaille plus directement avec \(S_{i,t}\), mais plutôt avec une sinistralité normalisée \(Y_{i,t}\).
Nous noterons ainsi la sinistralité moyenne pondérée comme:
\[Y_{i,W} = \frac{S_{i,\bullet}}{W_{i,\bullet}} = \frac{\sum_{t=1}^T S_{i,t}}{W_{i,\bullet}} = \frac{\sum_{t=1}^T W_{i,t} Y_{i,t}}{W_{i,\bullet}} = \sum_{t=1}^T \frac{W_{i,t}}{W_{i,\bullet}}Y_{i,t}\]
Nous noterons la sinistralité moyenne du portefeuille comme:
\[Y_{W,W} = \frac{\sum_{i=1}^m \sum_{t=1}^T S_{i,t}}{\sum_{i=1}^m W_{i,\bullet}} = \frac{\sum_{i=1}^m \sum_{t=1}^T W_{i,t} Y_{i,t}}{W_{\bullet,\bullet}} = \sum_{i=1}^m \sum_{t=1}^T \frac{W_{i,t}}{W_{\bullet,\bullet}}Y_{i,t} = \sum_{i=1}^m \frac{W_{i,\bullet}}{W_{\bullet,\bullet}}Y_{i,W}\]
La forme de la prime de crédibilité de Bühlmann-Straub est ainsi:
\[p_{i,T+1}^{(Y)} = \mathsf{Z}_i \times Y_{i,W} + b.\]
La prédiction linéaire est ainsi faite sur la sinistralité normalisée. Ainsi, pour résumer un élément important:
Le modèle de crédibilité de Bühlmann: la valeur \(p_{i,T+1}^{(S)}\) cherche à approximer la sinistralité \(S\),
Le modèle de crédibilité de Bühlmann-Straub: la valeur \(p_{i,T+1}^{(Y)}\) cherche à approximer la sinistralité normalisée \(Y\).
1.1.6 Approximation de la sinistralité future
Proposition 1.1 Les paramètres \(\mathsf{Z_i}\) et \(b_i\) qui minimisent la fonction \(E[(p_{i, T+1}^{(Y)} - Y_{i, T+1})^2]\) sont:
\[\begin{eqnarray*} \mathsf{Z}_i &=& \frac{Cov[Y_{i,W}, Y_{i, T+1}]}{Var[Y_{i,W}]}, \ \text{ et } \ b = (1-\mathsf{Z}_i) \mu \end{eqnarray*}\]
et la prime \(p_{i,T+1}\) s’exprime comme:
\[p_{i,T+1}^{(Y)} = \mathsf{Z}_i \times Y_{i,W} + (1-\mathsf{Z}_i) \mu \]
(Développement à faire en classe)
Proposition 1.2 Puisque \(p_{i,T+1}^{(Y)}\) approxime la sinistralité future normalisée, l’approximation de la sinistralité future \(S_{i,T+1}\) du modèle de Bühlmann-Straub, notée \(p_{i,T+1}^{(S)}\), correspond à la prime de crédibilité normalisée multipliée par le poids de l’assuré \(i\) au temps \(T+1\):
\[p_{i,T+1}^{(S)} = p_{i,T+1}^{(Y)} \times W_{i,T+1}\]
1.1.7 Paramètres de structure
Proposition 1.3 La covariance entre la moyenne pondérée de la sinistralité normalisée et la prime de risque s’exprime comme:
\[Cov[Y_{i,W}, Y_{i, T+1}] = Var\left[\mu(\Theta) \right] = M^2\]
(Développement à faire en classe)
Proposition 1.4 La variance de la moyenne pondérée de la sinistralité normalisée s’exprime comme:
\[Var[Y_{i,W}] = \frac{1}{W_{i \bullet}} \Sigma^2 + M^2 \]
(Développement à faire en classe)
Proposition 1.5 Le facteur de crédibilité pour la \(i^e\) police est:
\[\begin{eqnarray*} \mathbf{Z}_i &=& \frac{Cov[Y_{i,W}, \mu(\Theta)]}{Var[Y_{i,W}]}\\ &=& \frac{M^2}{\frac{1}{W_{i \bullet}} \Sigma^2 + M^2} \\ &=& \frac{W_{i \bullet}}{W_{i \bullet} + K} \text{ où } K = \frac{\Sigma^2}{M^2} \end{eqnarray*}\]
1.1.8 Bühlmann et Bühlmann-Straub
Ainsi, nous pouvons voir que le modèle de Bühlmann-Straub ne fait que généraliser le modèle de Bühlmann. En effet, si \(W_{i,t} =1\) pour tous les contrats \(t\) de tous les assurés \(i\), nous avons:
\(Y_{i,t} = \frac{S_{i,t}}{W_{i,t}} = S_{i,t}\)
\(W_{i \bullet} = \sum_{t=1}^{T} W_{i,t} = W_{i \bullet} = T\)
\(\mathbf{Z}_i = \frac{W_{i \bullet}}{W_{i \bullet} + K} = \frac{T}{T + K} \text{ où } K = \frac{\Sigma^2}{M^2}\)
Étant donné que l’approche de Bühlmann-Straub n’est qu’une généralisation de la crédibilité de Bühlmann, plusieurs des analyses que nous avons déjà faites tiennent encore. Par exemple, l’analyse du coefficient de crédibilité, en fonction de \(\Sigma^2\) et \(M^2\) est la même.
Au lieu d’analyser le comportement du coefficient \(\mathbf{Z}_i\) en fonction de \(T\) comme dans le modèle de Bühlmann, on l’analysera en fonction de \(W_{i \bullet}\).
1.1.9 Exemples
Exemple 1.6 On suppose que le coût total des réclamations annuelles d’un assuré pour son contrat \(t\) suit une loi normale de moyenne \(\lambda_t \theta\) et de variance \(100\). Formellement, nous avons ainsi
\[S_{t} |\Theta = \theta \sim Normal(\lambda_t \theta, \sigma^2 = 100,000).\]
Les actuaires pensent qu’il existe 3 types d’assurés dans le portefeuille:
\[\begin{eqnarray*} \Pr(\Theta = \theta) = \begin{cases} 0.2, \ \text{pour } \theta=0.750\\ 0.3, \ \text{pour } \theta=1.000\\ 0.5, \ \text{pour } \theta=1.100\\ \end{cases}, \end{eqnarray*}\]
Un assuré a été observé pendant 3 contrats annuels, et cherche à s’assurer pour une 4e année. Les sinistres réclamés et les valeurs de ses paramètres \(\lambda_t\) pour \(t=1,2,3,4\) sont:
| Année (\(t\)) | \(\lambda_t\) | \(s_t\) |
|---|---|---|
| \(1\) | \(1000\) | \(12,000\) |
| \(2\) | \(1200\) | \(3,000\) |
| \(3\) | \(750\) | \(1,000\) |
| \(4\) | \(1200\) | ? |
A l’aide de l’approche de Bühlmann-Straub, répondez aux questions suivantes:
- Calculez la prime a priori de cet assuré au temps \(t=4\);
- Calculez la valeur du coefficient \(\mathsf{Z}\) pour ce modèle;
- Trouvez la prime de crédibilité de Bühlmann pour l’année 4;
- Comparez les résultats obtenus avec un calcul bayésien.
(Exemple à faire en classe)
Le modèle \(S_{t}|\Theta \sim Poisson(\lambda_{t} \Theta)\) avec \(\Theta \sim Gamma(\alpha, \alpha)\) est un exemple intéressant d’une application théorique du modèle de Bühlmann-Straub. En effet, puisque \(Var[S_{t}|\Theta] = \lambda_{t} \Theta\) n’est pas constante dans le temps, le modèle de Bühlmann n’est pas apte à modéliser ce mélange de distributions.
Exercice 1.9 Montrez comment le mélange \(S_{t}|\Theta \sim Poisson(\lambda_{t} \Theta)\) avec \(\Theta \sim Gamma(\alpha, \alpha)\) se modélise par le modèle de crédibilité de Bühlmann-Straub.
(Développement à faire en classe)
Il est intéressant de bien comprendre le dernier exemple:
On inteprète \(\lambda_{t}\) comme le poids \(\mathbf{Z}\) accordé à l’expérience de sinistre de l’assuré pour son contrat \(t\);
Il est injuste de comparer directement l’expérience de sinistre de deux assurés sans inclure la prime a priori \(\lambda_{t}\) de chaque assuré, pour chacun de leur contrat \(t\), dans la comparaison;
Plus \(\lambda_{t}\) est élevée, plus on s’attend à avoir une expérience de sinistre élevée.
Dans le chapitre intitulé Crédibilité linéaire exacte, nous avions vu sous quelles conditions le modèle de crédibilité linéaire donnait la même prime prédictive que le modèle bayésien. Évidemment, un développement similaire peut être fait pour l’approche Bühlmann-Straub. Nous verrons ces conditions dans un prochain chapitre (si nous avons le temps).
1.1.10 Estimateurs des paramètres de structures
Tout comme dans le modèle de Bühlmann, on doit proposer des estimateurs de \(M^2\), \(\Sigma^2\) et \(\mu = E[\mu(\theta)]\).
- Estimation de \(\mu\):
\[\begin{eqnarray*} \hat{\mu} &=& \sum_i^m \frac{W_{i \bullet}}{W_{\bullet \bullet}} X_{i W} = X_{W W} \end{eqnarray*}\]
- Estimation de \(\Sigma^2\)
\[\begin{eqnarray*} \widehat{\Sigma^2} &=& \frac{1}{m (T-1)} \sum_{i=1}^{m} \sum_{t=1}^{T} W_{i t}(X_{it} - X_{i W})^2 \end{eqnarray*}\]
- Estimation de \(M^2\)
\[\begin{eqnarray*} \widehat{M^2} = \frac{W_{\bullet \bullet}}{W_{\bullet \bullet}^2 - \sum_i^m W_{i \bullet}^2} \sum_{i=1}^{m} W_{i \bullet} (X_{i W} - X_{W W})^2 - (m-1) \widehat{\Sigma^2} \end{eqnarray*}\]
Exemple 1.7 Calculez les primes de crédibilité pour la 4e année des deux groupes dont l’expérience est décrite dans le tableau suivant:
| Groupe | Statistique | An 1 | An 2 | An 3 | An 4 |
|---|---|---|---|---|---|
| 1 | Montant des réclamations | 8000 | 11,000 | 15,000 | . |
| Taille du groupe | 40 | 50 | 70 | 75 | |
| 2 | Montant des réclamations | 20,000 | 24,000 | 19,000 | . |
| Taille du groupe | 100 | 120 | 115 | 95 |
(Développement à faire en classe)
1.1.10.1 Base de données non-équilibrée
Dans le chapitre sur le modèle de Bühlmann, nous avions vu qu’une base de données équilibrée correspondait à la situation où tous les assurés \(i=1,\ldots,m\) sont observés pendant le même nombre de contrats. Dans la table ci-dessous, on observait tous les \(m\) assurés pendant \(T\) contrats.
| Assuré | Contrat 1 | Contrat 2 | … | Contrat T |
|---|---|---|---|---|
| 1 | \(s_{1,1}\) | \(s_{1,2}\) | … | \(s_{1,T}\) |
| 2 | \(s_{2,1}\) | \(s_{2,2}\) | … | \(s_{2,T}\) |
| … | … | … | … | … |
| \(m\) | \(s_{m,1}\) | \(s_{m,2}\) | … | \(s_{m,T}\) |
En pratique, les données des assureurs ne sont pas équilibrées. De quelle manière peut-on changer nos estimateurs de crédibilité dans une telle situation?
3- Calcul des estimateurs des paramètres de structure:
\[\begin{eqnarray*} \hat{\mu} &=& \sum_i^2 \frac{W_{i \bullet}}{W_{\bullet \bullet}} X_{i W} \\ &=& \frac{7*1 + 9*1/3}{7+9} = 5/8 \end{eqnarray*}\]
L’équation vue précédemment ne s’applique plus….
\[\begin{eqnarray*} \widehat{\Sigma^2} &=& \frac{1}{m (T-1)} \sum_{i=1}^{m} \sum_{t=1}^{T} W_{i t}(X_{it} - X_{i W})^2 \end{eqnarray*}\]
Nous utilisons plutôt:
\[\begin{eqnarray*} \widehat{\Sigma^2} &=& \frac{1}{\sum_{i=1}^{m} (T_i - 1)} \sum_{i=1}^{m} \sum_{t=1}^{T} W_{i t}(X_{it} - X_{i W})^2\\ \end{eqnarray*}\]
avec \(T_1 = 4\) et \(T_2=3\) !
\[\begin{eqnarray*} \widehat{M^2} &=& \frac{W_{\bullet \bullet}}{W_{\bullet \bullet}^2 - \sum_i^m W_{i \bullet}^2} \left(\sum_{i=1}^{m} W_{i \bullet} (X_{i W} - X_{W W})^2 - (m-1) \widehat{\Sigma^2} \right) \\ &=& \frac{16}{16^2 - (7^2 + 9^2) } \Big[ 7 (1 - 5/8)^2 + 9(1/3 - 5/8)^2 - (2-1) 11/30 \Big]\\ &=& 0.1757 \end{eqnarray*}\]
Exemple 1.8 Calculez les primes de crédibilité pour l’année \(2016\) des deux flottes de véhicules suivantes, dont l’expérience est décrite ici:
| Flotte | Statistique | 2015 | 2014 | 2013 | 2012 |
|---|---|---|---|---|---|
| 1 | Nombre de sinistres | 3 | 2 | 2 | 0 |
| Nombre de véhicules | 2 | 2 | 2 | 1 | |
| 2 | Nombre de sinistres | 2 | 1 | 0 | . |
| Nombre de véhicules | 4 | 3 | 2 | . |