Stan で多分割 多相 Rasch モデルを推定する

~人材採用の最適化を事例として ~

2018年12月20日
株式会社 知能情報システム
井上暁光

mensetsu_baito_india_man

はじめに

この記事では Stan を用いた、「polytomous (多分割)」 で 「multi-facet (多相)」 な Rasch モデルの推定方法を解説します。

本稿は以下のように構成されます。

解決したい課題

人材管理関連の仮想的な例を考えます。ある企業では採用において、複数の面接担当者に応募者の潜在的な能力を評価してもらい、その評価の素点を合計することで応募者の採否を決めてきました。しかし「なぜあの人を不採用にしたのか」「どういう経緯であの人が採用になったのか」という批判が多くあり、応募者の潜在的な能力を正しく推定できていないと考えられます。この業界においては、応募者の潜在的な能力は応募者全体で標準正規分布に従っていると考えられ、採用後に 1 標準偏差・1人あたり年間 100 万円程度の売上高の違いにつながると考えられています。

調査の結果、現状の方法で潜在的な能力を正しく推定できていない原因は、主に以下の 3 つにあることが分かりました。

  1. 採否の境界近辺の応募者の能力の違いが、素点合計の違いに表れていない (A さんと B さんは印象がかなり違うのになぜ素点合計が同じなのか ?)
  2. 面接担当者により評価の厳しさが異なるがその違いが反映されていない (X さんに当たると全員不採用、Y さんに当たると全員採用してないか ?)
  3. 素点の間隔の意味の違い ( 1 と 2 の違いは 2 と 3 の違いと意味合いが違う) が反映されていない (明らかに問題のある側面があるとき 1 にするのに、なぜこの人は採用されたのか ?)

そこで、上記の原因を解消し、素点合計に代わる指標を開発することになりました。目的は、これまでの素点合計に代わる指標を用いた採用により、潜在的な能力が高い応募者を優先して採用できるようにすることです。目標は、今期採用メンバーによる売上高が、前期採用メンバーによる売上高より 50 万円増とすることです。この企業は年間 10 人を採用しており、この目標を一人当たりに換算すると、50 (万円) / 100 (万円) / 10 (人) = 0.05 となり、潜在的な能力が平均で 0.05 標準偏差分高い人材を採用できるようにすることが、この分析の直接の目標となります。

Polytomous Multi-facet Rasch モデル

基本的なアプローチ

モデルの定義

Polytomous Multi-facet Rasch モデルは以下の式で表されます。

ここで、対象、項目、評価者を所与として、水準 が選ばれる確率に対する水準 が推定される確率の比の対数は以下で表されるという仮定をおくモデルが Rasch モデルです。

尤度で推定するために を陽に表した式が以下です。

Stan による実装

Stan による実装では、モデルが冗長なパラメータを含むことに気を付けてください。冗長であると、尤度を最大化する解が 1 つでなく無数に存在するので、パラメータの事後分布が正しく推定できません。これを防ぐため、本稿では、, , それぞれの和を 0 とする制約を与えます。

なお、実用上は MMLE 等の推定法を用いる方が高速となりますが、MCMC 法で推定する方法は、各パラメータの事前分布を与えたり、共変量を加えるなどのモデル拡張も容易であるといったメリットがあります。

以下に Stan による実装を示します。

分析例

データ セットの生成

課題の説明に適したデータを人工的に生成します。Rasch モデルに基づいてデータを生成しています。今回は理解を優先し、モデルの mis-specification については考えません。

素点合計の算出

既存の方法で素点を合計します。

Rasch モデル推定値の算出

Rasch モデルの最尤推定値を求めます。

採用シミュレーション

100 人の応募者から、素点合計の上位 10 人を抽出した場合と、Rasch モデルのパラメータ推定値をもとに上位 10 人を抽出した場合の、抽出された 10人の潜在的能力を比較します。

applicants potential abilities

Rasch モデルの推定値では平均値が高い 10 人を抽出できていることが分かります。

 素点合計に基づく上位 10 人Rasch 推定値に基づく上位 10 人
潜在的能力の平均値1.371.630.26

潜在的能力を 0.05 以上高めるという目標をこのデータで実現できたことが分かります。(誤差は評価していません)

免責事項

本稿の情報については十分な注意を払っておりますが、その内容の正確性等に対して一切保証するものではありません。本稿の利用で生じたいかなる結果についても、当社は一切責任を追わないものとします。

本稿の事例は、評価軸の数、種々の分布、採用プロセス、尺度を構成する項目群の設定などにおいて、単純化するための仮定を置いています。実務への応用に当たっては、これらの仮定をより詳細に検討してください。

参考文献

  1. Linacre, J. M. (1999). Understanding Rasch measurement: estimation methods for Rasch measures. Journal of outcome measurement, 3, 382-405.
  2. Mair & Hatzinger (2010), Fitting the Rasch Model in R - The eRm Package, http://statmath.wu-wien.ac.at/people/hatz/psychometrics/10w/RM_handouts_4.pdf

© Copyright 2018, 株式会社 知能情報システム