한국청소년정책연구원 도서관

로그인

한국청소년정책연구원 도서관

도서관 서비스

  1. 메인
  2. 도서관 서비스
  3. 신착도서

신착도서

단행본

예측 분석 모델링 실무 기법: R로 하는 빅데이터 분석 사례

발행사항
의왕: 에이콘, 2015
형태사항
404 p: 삽도, 24cm
서지주기
참고문헌과 색인을 포함하고 있음
소장정보
위치등록번호청구기호 / 출력상태반납예정일
이용 가능 (1)
한국청소년정책연구원00025673대출가능-
이용 가능 (1)
  • 등록번호
    00025673
    상태/반납예정일
    대출가능
    -
    위치/청구기호(출력)
    한국청소년정책연구원
책 소개
★ 요약 ★

<가트너>에서 선정한 2015년 10대 전략기술 중의 하나인 '고차원분석'을 하기 위한 데이터 예측 분석기술을 실무사례 위주로 설명하는 책이다. 이 책은 데이터 기반 의사결정이 실제로 기업의 경쟁력에 어떻게 도움이 되는지 알고 싶어하는 경영자, 데이터 실무 분석역량을 키우고 싶은 데이터 분석가 모두를 대상으로 한다. 이 책을 통해 실제 현실에서 발생한 데이터를 사용하여 예측 분석문제를 해결해야 하는 데이터 분석가가 되어 관련된 다양한 문제를 직접 해결해 볼 수 있다. 그 밖에도 해당 문제를 실제로 해결하기 위한 R프로그램 코드를 가지고 설명한다. 독자는 이 책에서 제공하는 현실에서 일어나는 다양한 문제를 예측 분석방법으로 직접 해결해 보면서 분석 역량을 한층 더 높일 수 있을 것이며, 현실의 문제를 해결하는 데 예측 분석 기술이 어떻게 활용되고 있는지 구체적으로 이해할 수 있다.

★ 이 책에서 다루는 내용 ★

■ 광고와 홍보 분석
■ 소비자 선호와 선택 분석
■ 시장바구니와 관련된 구매 분석
■ 경제 예측 분석
■ 운영관리 분석
■ 비정형화된 텍스트와 언어에 대한 분석
■ 고객감성 분석
■ 브랜드 및 가격 분석
■ 스포츠 팀 성적 분석
■ 기타 다수의 분석

★ 이 책의 대상 독자 ★

이 책에서 제공하는 다양한 예측 분석 실무를 익힘으로써, 실제 비즈니스 문제를 해결하고 진정한 경쟁우위를 실천할 수 있는 능력을 보유할 수 있다. 현실에서 발생하는 다양한 데이터 분석 문제를 해결하고 싶다면, 이 책에서 제공하는 실제 문제와 해결 방법에 대한 내용을 습득하면 된다. 여러분이 모델개발자나 프로그래머 또는 관리자라면, 이 책을 통해 아직 갖추지 못한 중요한 기술을 습득할 수 있을 것이다.

★ 저자 서문 ★

"토토, 여긴 캔자스가 아닌 것 같아."
- 영화 <오즈의 마법사>(1939)에서 도로시 게일(주디 갈랜드 분)

데이터와 알고리즘은 우리의 일상생활을 지배하고 있다. 데이터 집약적이며 빠르게 변화하는 오픈 소스의 세상에 온 것을 환영한다. 이 세상에서 경쟁우위를 확보하는 것은 분석 능력과 아이디어를 공유함으로써 가능하지만, 잠시일 뿐이다.

예측 분석에 대한 많은 도서들은 전략과 경영에 대해 언급하거나, 분석 방법과 모델링을 주요 내용으로 하거나, 정보기술과 코드를 중점으로 다루기도 한다. 그러나 이 책 『예측 분석 모델링 실무 기법』은 이와 같은 세 가지 접근 방식을 동시에 취함으로써 모델개발자, 프로그래머, 비즈니스 경영자 모두를 독자 대상으로 하는 독특한 책이라고 할 수 있다.

우리는 경쟁우위 확보에 분석이 얼마나 중요한가를 인식하고 있다. 연구원과 분석가를 위해서 바로 써먹을 수 있는 자료와 모델링 기술에 적합한 참고가이드를 제공했다. 또한, 프로그래머를 위해 실제 비즈니스 문제를 해결하는 데 사용하는 코드 작성법을 설명했다. 이외에 경영자가 이해할 수 있도록 하기 위해서 모형의 결과를 단어나 그림으로 변환해 데이터와 모형에 대해 설명했다.

분석에 적합한 데이터의 종류와 양이 많아지고 데이터의 발생 속도와 분석 요구가 점점 빨라짐에 따라 날이 갈수록 분석은 점점 중요한 분야로 부각되고 있다. 경쟁우위의 확보는 정보 관리와 분석 분야에 새로운 시스템을 도입함을 의미한다. 이러한 사실은 비즈니스가 이루어지는 방법이 계속해서 변경된다는 것을 의미한다.

다양한 응용 분야를 다루고 있는 이 책은 데이터와 모델링 기술, 분석의 장점을 알고 있는 독자를 위한 책이다. 또한, 조직에서 변화가 발생하기를 희망하는 사람을 위한 책이기도 하다.

예측 분석은 데이터 과학이다. 이러한 분야의 책은 광범위하고 많은 학술적인 범위와 응용 분야를 다룬다. R에 한정해 보더라도 데이터 분석과 관련된 코드는 매우 빠르게 성장하고 있다. 사실 예측 분석에 대한 광범위한 가이드를 제공하는 것 또한 매우 도전적인 일이다. 우리는 단원별로 특정 응용 분야와 비즈니스 문제에 초점을 맞춘 짧은 글을 제공해 설명했다.

이와 같이 우리의 목표는 독자들에게 다가갈 수 있는 예측 분석과 데이터 과학에 대한 내용을 소개하는 것이다. 이 책에는 수학적 내용이 많지 않다. 통계학자와 모델개발자는 이와 같은 방법에 대한 상세내용이나 파생 분야에 대해서는 참고자료를 찾아보는 것이 좋다. 우리는 평이한 언어로 여러 방법들을 설명하고, 데이터 시각화를 사용해 비즈니스 문제에 대한 해결 방안을 만들어 냈다.

책의 주제를 감안할 때, 내가 고전적 또는 베이지안 캠프 중 어느 한 쪽에 속하는지를 궁금해 한다. 미네소타 대학의 통계학 강좌에서, 나는 고전/베이지안 분할에 대한 양측을 존중해야 한다는 것을 알았다. 그리고 매우 경험적인 베이지안과 기계 학습 및 전통적인 통계를 연계한 통계 학습 분야에서 분석을 하고 있는 사람들의 관점으로 인식했다. 모델링과 추론에 관한 한 나는 실용주의자다. 일어난 현상을 분석하고 불확실한 부분을 다른 사람들이 이해할 수 있는 문장으로 표현한다.

이 책이 가능했던 것은 R 커뮤니티에 시간과 아이디어를 제공한 수천만 명의 전문가 덕택이다. R 언어의 성장으로 인하여 예측 분석 분야에서 모델링 기술을 위한 R 환경은 확실히 널리 사용되어 일반화 툴이 될 것이다. 지니는 램프에서 나와 커튼 뒤에서 마법이 이루어진다. 하지만, 로켓 과학의 경우는 다르다. 과학의 힘으로 비밀을 밝혀낼 수 있다. 이 책은 이러한 과정의 일부분이라고 할 수 있다.

이 책에서 사용한 데이터 대부분은 공공 도메인 데이터 소스에서 확보한 것이다. 버블헤드 인형에 대한 홍보 데이터는 에리카 코스텔로가 제공했다. 컴퓨터 선택 연구 데이터는 샤론 캠버라인의 지원을 받았으며, 무명은행 콜센터 데이터는 아비 만델바움과 랜 게드가 제공했다. 영화 정보는 인터넷 영화 DB 허가를 얻어 기입했다.

IMDb 영화 리뷰 데이터는 스탠포드 대학에 있는 앤드류 L. 매스와 동료들에 의해 구축되었다. 몇몇 예제는 NCR 컴텐(Comten), HP, 메디슨의 조합 택시 협동조합, 뉴욕의 사이트 애널리틱스(Site Analytics), 위스콘신 메디슨의 선시드 연구 LLC와 함께 작업했다.

광범위한 R 문헌 네트워크의 짧은 글을 이용해, 이 책의 프로그램 예제는 R로 해볼 수 있는 것을 보여준다. 우리는 오픈 소스의 세상에서 일을 하고 다른 사람들과 공유하고 있다. 우리가 분석한 작업에 대한 내용은 모든 사람들이 보고 디버깅해보는 프로그램 안에 있다. 이 책의 코드는 학생들이 학습할 수 있도록 단계별로 주석을 포함하고 있다. 각 프로그램의 예제는 설명한 분석에 근거한 내용으로 완성했다.
목차
1장 분석과 데이터 과학 2장 광고와 홍보 3장 선호도와 선택 4장 시장바구니 분석 5장 경제 데이터 분석 6장 운영관리 7장 텍스트 분석 8장 감성 분석 9장 스포츠 분석 10장 브랜드와 가격 11장 공간데이터 분석 12장 빅 리틀 데이터 게임 부록 A 분석용으로 꾸린 짐 부록 B 측정 부록 C 코드와 유틸리티