2018年10月10日水曜日

失われたアインシュタイン?(Bell et al. 2018)

今学期の格差の授業で2018年に出た未出版のワーキングペーパーを毎週サマライズして評価(擬似査読)しなければならない。毎回できるとは思わないが、時々そのメモを残しておこうと思う。


Bell,  Alex,  Raj  Chetty,  Xavier  Jaravel,  Neviana  Petkova  and  John  van  Reenen,  2018.  “Who  Becomes  an  Inventor  in  America?  The  Importance  of  Exposure  to  Innovation.”NBER Working Paper No. 24062


要旨:
 論文では特許をもつ人が「発明家」と定義され、発明家になる人の人口特性と発明家になる環境要因が検討される。データは3つのデータの組み合わせで、(i)1976年から2014年にアメリカで受理された特許申請、(ii)1996年から2012年までの米の税データ、(iii)1988年から2009年までのニューヨーク市における3年生から8年生までの学力テストデータである。論文中では目的に応じて(i)(ii)(iii)がマッチングされている。ちなみにマッチングには特許申請に記載されている開発者の名前と居住地、租税データ中の名前(被扶養者含む)と居住地を使っており(さすがチェティ!)、80%以上マッチングできたらしい。ちなみに、他にもニューヨークのテストデータのサンプルがどの大学に行ったか等もマッチして分析しているのだが、それは本論にはあまり関係ない。
 分析では出生時の人口学的特性(人種、親の所得、性別)は、数学のテストスコアを統制した後も発明の確率に一定の影響をもっていることが示され、環境要因の分析に移る。分析で示されるのは親が発明をしていることや親の同僚(同じ地区で同じ産業で働いている人)が発明をしていることは、成人後の発明に影響すること、子供の頃に住んでいた地区(ZIPコード)の発明家率は、後に発明家になる確率に影響しており、これは引っ越しを経験したサブサンプルで、引っ越し後の地区の発明家率や親が発明をしていることをコントロールしても見出される。さらには445の発明の技術区分(特許が申請された技術区分)ごとに同じ分析を行うと、特定の区分に該当する特許が申請される率が高い地域に子供時代に住んでいたことが、後に同じ区分に分類される特許を申請する確率に影響する。また女性にとっては、子供時代に女性の発明家比率が高い地区に住んでいたことが、成人後に発明家になることに影響することが示される。この他に高インパクト発明(被引用率が高い発明)に関する同様の分析も行ない、人口学的特性や居住地区が影響していることが示される。
 最後に、人種、親の所得、性別た居住地区によって発明の機会を奪われた人(「失われたアインスタイン」)に関してかなりざっくりした議論が行われる。

コメント:
・正直、445の技術区分の効果が出たあたりで「本当かよ?」と思ったし、授業での評判も悪かったが、まあこんだけデータあったら何か結果は出せるものなのかもしれない。チェティー の論文のデータはどれもすごいことは認めざるを得ない(ブラウンにもチェティー とよく論文を書いている人がいて何度か発表を聞いたのだが、本当にすごい)。3-5年後に論文として出ると思われるので、どういう形で出るのか気になるところだ。
・著者らは近隣効果を学校の質やネットワークの効果と解釈しているが、その妥当性も気になった。
・経済学部の授業をとり始めてから感じるのだが、社会学者が安易?にロジットモデルとか使うところも経済学論文は大抵OLSで推定している(なるべくシンプル!)。この論文も従属変数は発明家になること(ダミー変数)だったが、線形確率モデルで推定されていた。確かにロジットモデルだと複数のモデル間の係数を比較することもできないし、解釈もほんのちょっと面倒くさいので、特殊な理由がない限りは線形確率モデルを推定して誤差を修正する方が良いのかもしれない。というか最近はマルチレベル分析とかもなるべくしないで大抵の誤差のクラスタリングの問題もOLSでクラスターロバスト標準誤差を事後的に計算する方が良い(早くて簡単)気がしてきているがこれはまた別の話である。。