소장정보
위치 | 등록번호 | 청구기호 / 출력 | 상태 | 반납예정일 |
---|---|---|---|---|
이용 가능 (1) | ||||
한국청소년정책연구원 | 00027444 | 대출가능 | - |
이용 가능 (1)
- 등록번호
- 00027444
- 상태/반납예정일
- 대출가능
- -
- 위치/청구기호(출력)
- 한국청소년정책연구원
책 소개
저자 서문
패널 데이터 혹은 종단 자료란 여러 개체들을 복수의 시간에 걸쳐서 추적 조사함으로써 얻는 데이터를 말한다. 1998년 이래로 5,000개 가구를 추적 조사해 온 한국노동패널이 대표적인 사례이다. 패널 데이터는 각 개체의 관측되지 않는 고유 속성으로 인한 차이를 통제할 수 있게 해 준다. 예를 들어 개인들의 패널이라면 각 개인의 유전적·환경적 차이를 고려할 수 있고, 국가들의 패널이라면 각 국가의 역사적·문화적 차이를 통제할 수 있다. 그 결과 패널 데이터는 횡단면 데이터나 시계열 데이터와 다른 새로운 측면에서 경제현상들을 바라볼 수 있게 한다.
이 책은 이러한 패널 데이터를 분석하는 방법에 관한 것이다. 패널 데이터에서는 기본적으로 각 변수마다 2차원의 구조를 가지며 그 분석 모형이 다채롭고 결과의 해석이 매우 흥미롭다. 연구자는 우리 주변의 다양한 경제현상과 사회현상에 관하여 패널 데이터의 형태로 존재하는 풍부한 정보들을 올바르게 추출하고 해석함으로써, 우리 주변 세계에 관한 의미있고 심오한 통찰을 얻을 수 있을 것이다.
이 책을 쓴 목적은 계량경제학에 대한 기초 지식을 갖춘 독자들이 패널 데이터 분석 방법에 대하여 공부하여 독립적으로 연구논문을 작성할 수 있도록 돕기 위함이다. 저자의 경험을 바탕으로 실제 응용연구에서 등장하는 여러 문제들에 중점을 두면서 패널 데이터 계량경제학의 전체적인 내용을 서술하려고 하였다. 패널 데이터의 분석 과정은 통상적인 의사소통 방식, 즉 언어만을 사용해서는 의도한 내용을 제대로 전달하기 어려울 만큼 충분히 복잡하다. 다시 말하자면 수학을 사용하여 설명하지 않으면 말하는 이와 듣는 이 사이에 오해가 발생하기 십상이라는 것이다. 이러한 점을 고려하여 필자는 언어적 서술과 수학적 설명의 균형을 맞춤으로써 지나치게 복잡하지도 지나치게 간단하지도 않게 설명하고자 노력하였다. 이를 위해 패널 데이터 분석 과정에서의 수학적 엄밀성, 내적 정합성, 심미성을 추구하기보다는 최대한 독자들이 쉽고 정확하면서도 패널 분석에 있어 미묘한 점들을 이해할 수 있는 방식으로 서술하고자 하였다. 또한 독서의 원활한 흐름을 위해 지나치게 학술적이고 기술적인 세부사항이 독해의 방해물이 되지 않도록 구성하려고 하였다. 그렇다고 하여 이 책이 기초적인 내용만을 담고 있는 것은 아니며, 연구자들이 실제 연구에서 직면하는 문제들을 깊이 있게 논의하고자 하였다.
이와 더불어 이 책에서 심혈을 기울인 것 중의 하나는 적절한 예제들을 제공함으로써 독자들이 실제로 패널 데이터를 분석해 볼 수 있도록 한 점이다. 이를 위한 소프트웨어로 Stata를 사용하였다. Free software로 R이 있기는 하지만, 기초 계량경제학과는 달리 내용의 설명만으로도 매우 복잡하여 프로그래밍까지 자세히 다루기는 어려웠다. 보다 쉽고 간편한 패키지를 찾다 보니 Stata를 선택하게 되었다. Stata는 유료 소프트웨어이기는 하지만 패널 분석에서 널리 이용되고 있고 사용이 간편하다는 장점이 있다. 이 책에 제시된 Stata 코드들은 저자가 여기저기서 다양한 방법으로 배운 것들을 기초로 한다. Stata 매뉴얼, 인터넷 검색, 수많은 시행착오, 그리고 무엇보다도 동료 및 학생들과의 대화가 많은 도움이 되었다. 이 책에서 사용된 모든 데이터와 여타 학습 자료는 이 책의 웹사이트인 econ.korea.ac.kr/~chirokhan/panelbook에서 찾아볼 수 있다. 독자들은 이 실습예제들을 직접 실행해 봄으로써 많은 내용들을 효과적으로 배워나갈 수 있을 것으로 기대한다.
Donald Knuth가 The TEXbook (1986)에서 사용한 ‘ ’ 표시는 내용이 수학적이거나 어려울 수 있으므로 처음 읽을 때에는 건너뛰어도 좋음을 뜻한다. 이 표시가 두세 번 중복되는 곳은 더욱 미묘하고 어려울 수 있으므로 특별한 주의를 기울여 주기 바란다.
이 책의 저술이 쉽지는 않았다. 수학에 전적으로 의존하지 않으면서 이 주제를 저자의 의도대로 전달하는 것이 얼마나 어려운 일인지 절실히 느끼는 시간들이었다. 설명이 너무 간단하거나 너무 복잡하여 독자들이 이해하기 어렵지 않을지, 수식이 너무 간단하거나 복잡하여 따라가기 힘들지는 않는지 노심초사하며 많은 시간이 흘렀다. 독자들의 편의와 이해를 돕기 위해 원고를 수십 번 읽으면서 고치기를 반복했다. 그러나 사람이 하는 일에 완벽이란 있을 수 없으며 여전히 아쉬움이 남지만, 적어도 독자들에게 도움이 될 만한 최소한의 수준에는 이르렀다고 판단하여 출판을 단행하게 되었다. 앞으로 독자들과의 소통과 교감을 통하여 이 책의 부족함이 채워져 나가리라 믿는다.
이 책이 완성되기까지 많은 분들의 도움이 있었다. 저자가 이 책을 준비한다는 소식에 아낌 없는 격려와 응원을 보내 준 동료 교수들과 연구자들에게 감사한다. 고려대학교 박사과정 이고은 학생은 원고를 꼼꼼히 읽고 교정에 많은 도움을 주었으며 실습 예제들이 제대로 작동하는지 확인하여 주었다. 또한, 많은 대학원 학생들이 이 책의 초고를 저자의 의도대로 혹은 저자의 의도와 다르게 이해함으로써 이 책의 저술 방향과 내용에 신선한 통찰과 도움을 주었다. 이 책이 세상에 나오기까지 많은 수고를 해 주신 박영사에도 감사드린다. 마지막으로 내 삶의 원동력인 가족들에게 사랑과 고마움을 전한다.
2017년 2월
한치록
패널 데이터 혹은 종단 자료란 여러 개체들을 복수의 시간에 걸쳐서 추적 조사함으로써 얻는 데이터를 말한다. 1998년 이래로 5,000개 가구를 추적 조사해 온 한국노동패널이 대표적인 사례이다. 패널 데이터는 각 개체의 관측되지 않는 고유 속성으로 인한 차이를 통제할 수 있게 해 준다. 예를 들어 개인들의 패널이라면 각 개인의 유전적·환경적 차이를 고려할 수 있고, 국가들의 패널이라면 각 국가의 역사적·문화적 차이를 통제할 수 있다. 그 결과 패널 데이터는 횡단면 데이터나 시계열 데이터와 다른 새로운 측면에서 경제현상들을 바라볼 수 있게 한다.
이 책은 이러한 패널 데이터를 분석하는 방법에 관한 것이다. 패널 데이터에서는 기본적으로 각 변수마다 2차원의 구조를 가지며 그 분석 모형이 다채롭고 결과의 해석이 매우 흥미롭다. 연구자는 우리 주변의 다양한 경제현상과 사회현상에 관하여 패널 데이터의 형태로 존재하는 풍부한 정보들을 올바르게 추출하고 해석함으로써, 우리 주변 세계에 관한 의미있고 심오한 통찰을 얻을 수 있을 것이다.
이 책을 쓴 목적은 계량경제학에 대한 기초 지식을 갖춘 독자들이 패널 데이터 분석 방법에 대하여 공부하여 독립적으로 연구논문을 작성할 수 있도록 돕기 위함이다. 저자의 경험을 바탕으로 실제 응용연구에서 등장하는 여러 문제들에 중점을 두면서 패널 데이터 계량경제학의 전체적인 내용을 서술하려고 하였다. 패널 데이터의 분석 과정은 통상적인 의사소통 방식, 즉 언어만을 사용해서는 의도한 내용을 제대로 전달하기 어려울 만큼 충분히 복잡하다. 다시 말하자면 수학을 사용하여 설명하지 않으면 말하는 이와 듣는 이 사이에 오해가 발생하기 십상이라는 것이다. 이러한 점을 고려하여 필자는 언어적 서술과 수학적 설명의 균형을 맞춤으로써 지나치게 복잡하지도 지나치게 간단하지도 않게 설명하고자 노력하였다. 이를 위해 패널 데이터 분석 과정에서의 수학적 엄밀성, 내적 정합성, 심미성을 추구하기보다는 최대한 독자들이 쉽고 정확하면서도 패널 분석에 있어 미묘한 점들을 이해할 수 있는 방식으로 서술하고자 하였다. 또한 독서의 원활한 흐름을 위해 지나치게 학술적이고 기술적인 세부사항이 독해의 방해물이 되지 않도록 구성하려고 하였다. 그렇다고 하여 이 책이 기초적인 내용만을 담고 있는 것은 아니며, 연구자들이 실제 연구에서 직면하는 문제들을 깊이 있게 논의하고자 하였다.
이와 더불어 이 책에서 심혈을 기울인 것 중의 하나는 적절한 예제들을 제공함으로써 독자들이 실제로 패널 데이터를 분석해 볼 수 있도록 한 점이다. 이를 위한 소프트웨어로 Stata를 사용하였다. Free software로 R이 있기는 하지만, 기초 계량경제학과는 달리 내용의 설명만으로도 매우 복잡하여 프로그래밍까지 자세히 다루기는 어려웠다. 보다 쉽고 간편한 패키지를 찾다 보니 Stata를 선택하게 되었다. Stata는 유료 소프트웨어이기는 하지만 패널 분석에서 널리 이용되고 있고 사용이 간편하다는 장점이 있다. 이 책에 제시된 Stata 코드들은 저자가 여기저기서 다양한 방법으로 배운 것들을 기초로 한다. Stata 매뉴얼, 인터넷 검색, 수많은 시행착오, 그리고 무엇보다도 동료 및 학생들과의 대화가 많은 도움이 되었다. 이 책에서 사용된 모든 데이터와 여타 학습 자료는 이 책의 웹사이트인 econ.korea.ac.kr/~chirokhan/panelbook에서 찾아볼 수 있다. 독자들은 이 실습예제들을 직접 실행해 봄으로써 많은 내용들을 효과적으로 배워나갈 수 있을 것으로 기대한다.
Donald Knuth가 The TEXbook (1986)에서 사용한 ‘ ’ 표시는 내용이 수학적이거나 어려울 수 있으므로 처음 읽을 때에는 건너뛰어도 좋음을 뜻한다. 이 표시가 두세 번 중복되는 곳은 더욱 미묘하고 어려울 수 있으므로 특별한 주의를 기울여 주기 바란다.
이 책의 저술이 쉽지는 않았다. 수학에 전적으로 의존하지 않으면서 이 주제를 저자의 의도대로 전달하는 것이 얼마나 어려운 일인지 절실히 느끼는 시간들이었다. 설명이 너무 간단하거나 너무 복잡하여 독자들이 이해하기 어렵지 않을지, 수식이 너무 간단하거나 복잡하여 따라가기 힘들지는 않는지 노심초사하며 많은 시간이 흘렀다. 독자들의 편의와 이해를 돕기 위해 원고를 수십 번 읽으면서 고치기를 반복했다. 그러나 사람이 하는 일에 완벽이란 있을 수 없으며 여전히 아쉬움이 남지만, 적어도 독자들에게 도움이 될 만한 최소한의 수준에는 이르렀다고 판단하여 출판을 단행하게 되었다. 앞으로 독자들과의 소통과 교감을 통하여 이 책의 부족함이 채워져 나가리라 믿는다.
이 책이 완성되기까지 많은 분들의 도움이 있었다. 저자가 이 책을 준비한다는 소식에 아낌 없는 격려와 응원을 보내 준 동료 교수들과 연구자들에게 감사한다. 고려대학교 박사과정 이고은 학생은 원고를 꼼꼼히 읽고 교정에 많은 도움을 주었으며 실습 예제들이 제대로 작동하는지 확인하여 주었다. 또한, 많은 대학원 학생들이 이 책의 초고를 저자의 의도대로 혹은 저자의 의도와 다르게 이해함으로써 이 책의 저술 방향과 내용에 신선한 통찰과 도움을 주었다. 이 책이 세상에 나오기까지 많은 수고를 해 주신 박영사에도 감사드린다. 마지막으로 내 삶의 원동력인 가족들에게 사랑과 고마움을 전한다.
2017년 2월
한치록
목차
저자 서문 vi
제1장 준비 1
1.1 패널 데이터 1
1.2 계량경제학 기초 5
1.3 계량경제 소프트웨어 Stata 10
1.4 패널 데이터 저장 방법 14
제1부 선형 정태적 패널 모형
제2장 임의효과 모형 20
2.1 선형 패널모형의 기초 21
2.2 통합최소제곱법 23
2.3 임의효과 추정 34
2.4 최우추정법 48
2.5 선형 PA 모형의 GEE 추정 49
제3장 고정효과 모형 52
3.1 집단간 추정 54
3.2 고정효과 모형 59
3.3 1계차분 추정 66
3.4 고정효과 추정 70
3.5 더미변수 추정 84
3.6 계수의 해석과 모형 비교 90
3.7 Hausman과 Taylor의 방법 100
제4장 심화 주제들과 검정 109
4.1 네 가지 R제곱 110
4.2 공통의 경기변동과 시간더미 115
4.3 고정효과 추정과 더미 상호작용 118
4.4 개체별로 상이한 계수를 갖는 변수들을 통제하기 125
4.5 고정효과 대 임의효과의 검정 126
4.6 임의효과 존재 여부의 검정 145
4.7 이분산성, 횡단면 종속, 시계열 상관의 검정 148
제5장 도구변수 추정 155
5.1 집단내 추정과 집단간 추정의 도구변수 추정 표현 155
5.2 내생적 설명변수와 도구변수 추정 159
5.3 과거의 정보를 도구변수로 사용하는 방법 164
5.4 우변에 종속변수의 과거값이 있는 모형 165
제2부 선형 동태적 패널 모형
제6장 선형 동태적 패널모형 167
6.1 선형 동태적 모형과 계수의 해석 168
6.2 Anderson and Hsiao의 도구변수 추정 171
6.3 차분적률법 175
6.4 시스템적률법 183
제7장 모형설정 검정과 심화 주제들 188
7.1 모형설정 검정 188
7.2 고유오차가 등분산적이라는 가정하의 추정 194
7.3 임의효과 동태패널 모형 195
7.4 동태적 모형을 이용한 내생성 문제의 해결 199
7.5 Stata 명령에 관한 주석 205
제3부 비선형 모형과 심화 주제들
제8장 이항반응모형과 여타 모형들 227
8.1 모집단 평균 모형 227
8.2 임의효과 이항반응 모형 234
8.3 동태적 이항반응 임의효과 모형 240
8.4 고정효과 로짓 모형 242
8.5 여타 모형들 247
제9장 표본선택과 표본이탈 248
9.1 패널 데이터에서 표본선택과 표본이탈 248
9.2 전체 불균형패널과 균형화한 부분패널의 분석 250
9.3 선택편향의 검정 255
9.4 표본선택으로 인한 편향의 교정 255
9.5 표본이탈의 문제 263
제10장 시계열 주제와 횡단면 종속 266
10.1 패널 VAR 266
10.2 패널 단위근 274
10.3 횡단면 종속과 공간 패널 모형 280
10.4 요인 모형 281
부록 A 연습문제 풀이 283
부록 B 보론 288
B.1 패널 데이터에서 외생성과 내생성 288
B.2 겉보기에 상관없는 회귀식들(SUR) 289
B.3 상이한 개체 간의 상호의존성 293
B.4 횡단면 분석에서 이항반응모형 294
B.5 횡단면 분석에서 표본선택 297
B.6 부트스트랩 300
B.7 공간계량경제학 301
B.8 공통요인 추출과 주성분 분석 302
부록 C 적률법 305
C.1 일반화된 적률법 305
C.2 선형 횡단면 데이터 모형에서 GMM 310
C.3 적률조건 타당성의 검정 311
C.4 동태적 패널 모형의 차분적률법 313
부록 D 수학적 증명과 도출 315
D.1 설명변수가 동일할 때 SUR과 개별 OLS의 동일성 315
D.2 RE 추정을 위한 변환식의 도출 316
D.3 POLS 오차 분산 추정량의 극한 318
D.4 1계차분 GLS 추정량과 FE 추정량의 동일성 318
D.5 LSDV 추정량과 FE 추정량의 동일성 319
D.6 FE 로짓 추정량의 도출 320
참고문헌 322
찾아보기 327