단행본2021년 BEST 30
(머신러닝을 활용한)소셜 빅데이터 분석과 미래신호 예측
- 발행사항
- 서울: 한나래아카데미, 2017
- 형태사항
- 459 p.: 삽도, 26cm
- 서지주기
- 참고문헌과 색인을 포함하고 있음
소장정보
위치 | 등록번호 | 청구기호 / 출력 | 상태 | 반납예정일 |
---|---|---|---|---|
이용 가능 (1) | ||||
한국청소년정책연구원 | 00029507 | 대출가능 | - |
이용 가능 (1)
- 등록번호
- 00029507
- 상태/반납예정일
- 대출가능
- -
- 위치/청구기호(출력)
- 한국청소년정책연구원
책 소개
소셜 빅데이터 기반 미래신호 예측의 시대!
SNS를 비롯한 온라인 채널에서 생산되는 텍스트 형태의 비정형 데이터를 집적하여 분석하는 ‘소셜 빅데이터 기반 미래신호 예측’은 경제·사회의 실제 현상을 반영함으로써 정보로서 매우 높은 가치를 지닌다. 이에 오늘날 많은 국가와 기업에서 소셜 빅데이터를 활용한 미래 예측 연구를 활발히 진행하고 있으나, 수집기술과 분석기술의 어려움이 아직 과제로 남아 있다.
소셜 빅데이터는 데이터의 형식이 복잡하고 방대할 뿐만 아니라 생성속도가 매우 빨라 기존의 데이터 처리 방식이 아닌 새로운 분석방법을 필요로 한다. 그 때문에 데이터 자체보다는 이를 분석해 인과성을 발견하고 미래를 예측할 수 있는 데이터 사이언티스트의 역할이 중요하다. 지난 몇 년간 저자들은 빅데이터 수집과 분석, 정형 빅데이터와 비정형 소셜 빅데이터의 연결과 분석, 그리고 이를 활용한 미래신호 예측으로 연구를 심화·확장해왔다. 이 책은 데이터 사이언티스트로서 자신들의 역할에 성실히 임해온 저자들이 함께 일구어낸 결과로, 데이터 수집부터 분석과 고찰에 이르기까지, 실제로 소셜 빅데이터를 분석하여 미래를 예측하고 대응방안을 마련하기 위해 필요한 전체 연구과정을 깊이 있게 다루고 있다.
1. 실제 연구사례(청소년 우울 미래신호 예측)를 통해 소셜 빅데이터 분석의 다양한 연구방법론을 기술하였다. 모든 분석에는 오픈소스 프로그램인 R을 사용하고, 일부 내용은 SPSS와 비교해 설명하였다. 이로써 독자들이 통계분석(기술통계·추리통계), 머신러닝, 데이터마이닝, 시각화 분석 등을 통하여 분석결과를 비교할 수 있도록 하였다.
2. 온라인 문서에서 유용한 정보를 추출하는 텍스트 마이닝, 문서에 담긴 감정을 분석하는 오피니언 마이닝, 키워드 간 상호관계를 예측하는 머신러닝과 시각화 분석 과정 등을 폭넓게 담아 독자들이 자신의 연구에 적합한 방법을 찾고 적용할 수 있도록 하였다.
일례로 ‘비만 미래신호 예측’ 연구사례에서는 우리나라에서 수집 가능한 모든 온라인 채널을 통해 수집된 온라인 문서를 대상으로 자연어처리기술을 이용하여 텍스트마이닝과 감성분석을 실시하였다. 비만 미래신호를 탐색하기 위해 단어빈도, 문서빈도, TF-IDF를 분석하고, 키워드의 중요도(KEM)와 확산도(KIM)를 분석해 미래신호를 탐색하였다. 그리고 머신러닝 분석기술을 이용해 비만의 미래신호를 예측하고 미래신호 간 연관관계를 파악하였다.
3. 특히 최근 빅데이터 분석기술로서 각광받고 있는 머신러닝의 핵심 분석기술인 랜덤포레스트, 의사결정나무분석, 모형평가, 연관규칙분석에 대해 자세히 살펴보았다.
4. 연구 단계별로 본문을 구성하고 실제 연구사례를 상세히 기술하여 고급통계를 모르는 독자들도 쉽게 따라할 수 있도록 하였다.
5. 본문에 제시한 실전자료와 분석결과는 국내외 학회지에 게재하여 검증을 받은 것이다.
SNS를 비롯한 온라인 채널에서 생산되는 텍스트 형태의 비정형 데이터를 집적하여 분석하는 ‘소셜 빅데이터 기반 미래신호 예측’은 경제·사회의 실제 현상을 반영함으로써 정보로서 매우 높은 가치를 지닌다. 이에 오늘날 많은 국가와 기업에서 소셜 빅데이터를 활용한 미래 예측 연구를 활발히 진행하고 있으나, 수집기술과 분석기술의 어려움이 아직 과제로 남아 있다.
소셜 빅데이터는 데이터의 형식이 복잡하고 방대할 뿐만 아니라 생성속도가 매우 빨라 기존의 데이터 처리 방식이 아닌 새로운 분석방법을 필요로 한다. 그 때문에 데이터 자체보다는 이를 분석해 인과성을 발견하고 미래를 예측할 수 있는 데이터 사이언티스트의 역할이 중요하다. 지난 몇 년간 저자들은 빅데이터 수집과 분석, 정형 빅데이터와 비정형 소셜 빅데이터의 연결과 분석, 그리고 이를 활용한 미래신호 예측으로 연구를 심화·확장해왔다. 이 책은 데이터 사이언티스트로서 자신들의 역할에 성실히 임해온 저자들이 함께 일구어낸 결과로, 데이터 수집부터 분석과 고찰에 이르기까지, 실제로 소셜 빅데이터를 분석하여 미래를 예측하고 대응방안을 마련하기 위해 필요한 전체 연구과정을 깊이 있게 다루고 있다.
1. 실제 연구사례(청소년 우울 미래신호 예측)를 통해 소셜 빅데이터 분석의 다양한 연구방법론을 기술하였다. 모든 분석에는 오픈소스 프로그램인 R을 사용하고, 일부 내용은 SPSS와 비교해 설명하였다. 이로써 독자들이 통계분석(기술통계·추리통계), 머신러닝, 데이터마이닝, 시각화 분석 등을 통하여 분석결과를 비교할 수 있도록 하였다.
2. 온라인 문서에서 유용한 정보를 추출하는 텍스트 마이닝, 문서에 담긴 감정을 분석하는 오피니언 마이닝, 키워드 간 상호관계를 예측하는 머신러닝과 시각화 분석 과정 등을 폭넓게 담아 독자들이 자신의 연구에 적합한 방법을 찾고 적용할 수 있도록 하였다.
일례로 ‘비만 미래신호 예측’ 연구사례에서는 우리나라에서 수집 가능한 모든 온라인 채널을 통해 수집된 온라인 문서를 대상으로 자연어처리기술을 이용하여 텍스트마이닝과 감성분석을 실시하였다. 비만 미래신호를 탐색하기 위해 단어빈도, 문서빈도, TF-IDF를 분석하고, 키워드의 중요도(KEM)와 확산도(KIM)를 분석해 미래신호를 탐색하였다. 그리고 머신러닝 분석기술을 이용해 비만의 미래신호를 예측하고 미래신호 간 연관관계를 파악하였다.
3. 특히 최근 빅데이터 분석기술로서 각광받고 있는 머신러닝의 핵심 분석기술인 랜덤포레스트, 의사결정나무분석, 모형평가, 연관규칙분석에 대해 자세히 살펴보았다.
4. 연구 단계별로 본문을 구성하고 실제 연구사례를 상세히 기술하여 고급통계를 모르는 독자들도 쉽게 따라할 수 있도록 하였다.
5. 본문에 제시한 실전자료와 분석결과는 국내외 학회지에 게재하여 검증을 받은 것이다.
목차
1부 소셜 빅데이터 미래신호 예측방법론
1장 소셜 빅데이터 미래신호 예측과 활용방안
1 서론
2 소셜 빅데이터 분석과 활용
3 소셜 빅데이터 기반 미래신호 예측방법론
4 소셜 빅데이터 활용방안 및 제언
2장 소셜 빅데이터 미래신호 분석방법론
1 R의 개념 및 설치와 활용
2 SPSS의 개념 및 설치와 활용
3 과학적 연구설계
3장 머신러닝
1 랜덤포레스트
2 의사결정나무분석
3 분류모형 평가
4 연관분석
4장 시각화
1 텍스트 데이터의 시각화
2 시계열 데이터의 시각화
3 지리적 데이터의 시각화
4 소셜 네트워크 분석 데이터의 시각화
2부 소셜 빅데이터 미래신호 예측 연구실전
5장 보건복지정책 미래신호 예측
1 서론
2 이론적 배경
3 연구방법
4 연구결과
5 결론 및 제언
6장 ICT 미래신호 예측
1 서론
2 연구방법
3 연구결과
4 결론
7장 비만 미래신호 예측
1 서론
2 연구방법
3 결과
4 결론 및 제언