知っている人にとっては当たり前すぎる話なのだが、SPSSからStataに移行し始めたばかりの頃にxtlineコマンドの使い方を知らずに無駄な時間をかけてしまった。今後同じような問題にぶつかって検索をかける人がでないとも限らないと思い、メモしておく。正直、英語で検索するとわりと情報は豊富で、例えばUCLAのこのページなどはおすすめ。
以下では例として、Comparative Political Dataset(Armingeon et.al 2015)を用いる。使用するのはこのデータ中のyear変数(数値)、country変数(名義)、countryn変数(数値)、gov_right3変数(数値)である。gov_right3変数は各国議会における右派政党議席占有率(%)である。ちなみに、データ中の「右派政党」というのは例えば日本だと自民党、アメリカだと共和党、イギリスだと保守党のことらしい。他にも中道政党、左派政党があり、中道が日本だと民主党(民進党)、左派政党が社民党、共産党ということになる。ここら辺の分類は政治学の人に聞いてもらいたい。
データは既にロングの形式になっており以下のような形となっている。
データの形式 |
xtset id time
でパネルデータ分析をはじめることを定義する。ここではidがcountry、timeがyearにあたるが、注意したいのはxtsetコマンドには名義型変数が使用できないので、countrynという数値型に変換した変数を用いなければならない。具体的には、以下のようになる。
xtset countryn year
個人レベルのパネルデータの分析ならしようとは思わないことかもしれないが、カントリイヤーが単位のパネルデータの場合、特定変数のid×timeの情報をidごとにグラフにしたいと思うかもしれない(私は思った)。
その時にはxtlineという便利なコマンドがある。
xtline gov_right3
以上のコマンドで先ほどの右派政党議席占有率をグラフにすると以下のような図が出てくる。
1960-2013年×36カ国の右派政党議席占有率 (国の名前が数値で表示されている) |
しかし、当たり前だが出力の際に名義変数を指定する方法があった。さらにx軸、y軸の名前とかグラフの色とかも変更できる。知っている人にとっては当たり前のことなのだが、知らなかったら一苦労。方法としては以下のようにt(time) i(id) でtimeとidを指定し、この時のidには名義変数を選んでもよい。そもそもxtsetでパネルデータ分析を宣言していない場合にはt()とid()で変数を指定しなければならないので、本来はこちらのやり方を先に学ぶものなのかもしれない。xtitle("")とytitle("")でx軸、y軸の説明を変更し、さらにscheme()で色等を選ぶことができる。
xtline gov_right3 , t(year) i(country) xtitle("年") ytitle("右派政党") scheme(s1mono)
以上のコマンドを使うと以下のようなグラフが出てくる。
1960-2013年×36カ国の右派政党議席占有率 (国の名前が名義で表示されている) |
xtline gov_right3 if countryn < 10, overlay t(year) i(country) legend(off)
以上のコマンドをはしらせると以下のような図が出てくる。
id1-10の国の1960-2013の右派政党議席占有率 |
以上の使用のデータ出所
Armingeon, Klaus, Christian Isler, Laura Knöpfel, David Weisstanner and Sarah Engler. 2015. Comparative Political Data Set 1960-2013. Bern: Institute of Political Science, University of Berne.
0 件のコメント:
コメントを投稿