메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

한빛랩스 - 지식에 가능성을 머지하다 / 강의 콘텐츠 무료로 수강하시고 피드백을 남겨주세요. ▶︎

파이썬으로 배우는 통계학 교과서(2판)

기술통계, 통계모델, 선형모델, 머신러닝까지 통계학 입문을 위한 이론과 실전 가이드

한빛미디어

번역서

판매중

5점 (15명)
좋아요 : 1

파이썬 코드로 풀어보는 친절한 통계학 입문서

 

콘텐츠 추천, 데이터 분석 등 현대 사회의 중요한 의사결정은 통계를 기반으로 이루어집니다. 하지만 통계학의 수식과 이론만으로는 그 개념이 잘 와닿지 않을 때가 많습니다. 이 책은 그러한 어려움을 덜어주고자 이론과 더불어 파이썬 코드와 실습을 통해 직관적으로 이해할 수 있는 길을 안내합니다. 넘파이와 팬더스 라이브러리로 데이터를 분석하고, 맷플롯립과 시본을 이용해 데이터를 시각화합니다. 
 

기술통계, 확률과 분포, 통계적 추정, 가설검정 등 통계의 기본을 다지고 나아가 머신러닝과의 접점까지 살펴봅니다. 이론에만 머무르지 않고 실제 데이터를 분석하며 통계 이론을 익히는 방식은 통계를 학습하는 데 큰 도움이 될 것입니다. 통계가 어렵게만 느껴졌다면 이 책으로 시작해보세요.

 

바바 신야 저자

바바 신야

2014년 홋카이도 대학 수산과학원을 수료했다. 2020년 11월부터 도쿄의과치과 대학 비상근 강사, 2021년 2월부터 이와테대학 객원 부교수, 2022년 4월부터 테이쿄 대학 특임 강사를 맡고 있다. 통계학, 예측 분석, 파이썬, R 등을 다루는 Logics of Blue(https://logics-of-blue.com/)라는 웹사이트도 관리하고 있다.

저서로는 『平均・分散から始める一般化線形モデル入門』(プレアデス出版, 2015), 『時系列分析と状態空間モデルの基礎:RとStanで学ぶ理論と実装』(プレアデス出版, 2018), 『RとStanではじめるベイズ統計モデリングによるデータ分析入門』(講談社, 2019), 『R言語ではじめるプログラミングとデータ分析』(ソシム, 2019), 『意思決定分析と予測の活用基礎理論からPython実装まで』(講談社, 2021) 등이 있다.

 

윤웅식 역자

윤웅식

끊임없이 도전하고 배우는 개발자 또는 해결사. 키보드로 먹고산 지 꽤 오래된 것 같은데 아직도 배울 게 산더미라는 사실만 깨닫고 있다. 여러 스타트업을 전전하다 대기업으로 간 뒤 최신 기술의 최전선에서 구르는 중이다. 

좌우명은 “그럴 수도 있지!”

 

 

 

CHAPTER 1 통계학 기본
_1.1 통계학
_1.2 왜 기술통계가 필요한가
_1.3 왜 추론통계가 필요한가

 

CHAPTER 2 파이썬과 주피터 노트북
_2.1 환경 구축
_2.2 주피터 노트북
_2.3 파이썬 프로그래밍
_2.4 넘파이와 팬더스

 

CHAPTER 3 기술통계
_3.1 데이터 분류
_3.2 수식을 읽는 방법
_3.3 도수분포
_3.4 1변량 데이터 통계량
_3.5 다변량 데이터 통계량
_3.6 층화분석
_3.7 그래프 활용

 

CHAPTER 4 확률과 확률분포
_4.1 확률론
_4.2 확률분포
_4.3 이항분포
_4.4 정규분포

 

CHAPTER 5 통계적 추정
_5.1 통계적 추론의 개념
_5.2 모집단에서 표본추출 시뮬레이션
_5.3 모평균 추정
_5.4 모분산 추정
_5.5 정규모집단에서 파생된 확률분포
_5.6 구간추정

 

CHAPTER 6 통계적 가설검정
_6.1 모평균에 대한 단일표본 t검정
_6.2 평균값 차이 검정
_6.3 분할표 검정
_6.4 검정 결과 해석

 

CHAPTER 7 통계모델
_7.1 통계모델 기본
_7.2 선형모델을 만드는 방법
_7.3 데이터 표현과 모델 명칭
_7.4 파라미터 추정: 가능도 최대화
_7.5 파라미터 추정: 손실 최소화
_7.6 예측 정확도 평가와 변수 선택

 

CHAPTER 8 정규선형모델
_8.1 연속형 독립변수가 하나인 모델: 단순회귀
_8.2 정규선형모델 평가
_8.3 분산분석
_8.4 독립변수가 여럿인 모델

 

CHAPTER 9 일반화선형모델
_9.1 일반화선형모델 기본
_9.2 로지스틱 회귀
_9.3 일반화선형모델 평가
_9.4 푸아송 회귀

 

CHAPTER 10 통계학과 머신러닝
_10.1 머신러닝 기본
_10.2 정규화와 리지 회귀, 라소 회귀
_10.3 파이썬을 이용한 리지 회귀와 라소 회귀
_10.4 선형모델과 신경망

수식과 파이썬 코드로 이해하는 기초와 실전!
데이터 분석에서 머신러닝까지
파이썬으로 배우는 통계

 

통계학이 어렵게 느껴지는 이유 중 하나는 이해해야 할 것이 너무 많다는 점입니다. 중요한 점은 개념 간 연결 관계를 파악하는 것입니다. 이 책은 독자가 개념들이 서로 어떻게 관련되어 있는지 쉽게 이해할 수 있도록 구성되었습니다.

 

1장에서 6장까지는 통계학 입문서의 성격을 띠며 기술통계, 확률과 분포의 기본, 통계적 추정 및 통계적 가설검정을 다룹니다. 7장부터 10장에서는 통계모델, 회귀분석, 선형모델 등의 분석 방법을 알아봅니다. 또한 예측 기술로서 머신러닝과의 접점을 다루어 통계학 기초부터 머신러닝에 이르기까지의 흐름을 이해할 수 있도록 구성했습니다.

 

통계에 관한 세세한 노하우와 팁보다는 통계 용어와 기본 수식, 간단한 파이썬 문법으로 구현하는 데 집중하여 통계학 기초를 다지기 위해 최선을 다했습니다. 글, 수식, 파이썬 코드로 같은 내용을 세 번에 걸쳐 설명하므로 점차 깊이 있게 내용을 이해할 수 있을 것입니다. 통계를 모르는 개발자나, 파이썬이 익숙하지 않지만 통계를 공부해보려는 독자가 데이터 분석에 필요한 통계를 배우려 한다면 이 책을 추천합니다.

 

초판과 달라진 점

  • 초보자가 쉽게 학습할 수 있도록 구현 순서를 따라가며 해설하는 방식으로 구성을 개선했습니다.
  • 이 책은 파이썬을 사용해 데이터를 분석하고 싶은 분들을 위한 책입니다. 파이썬 실습 코드를 점검하고 수정했습니다.
  • 기술통계, 추론통계 실습 등에 대한 내용이 늘었습니다. 데이터를 처리하는 데 매우 중요한 기술이나 아이디어를 설명하는 부분이 늘었고, 층화분석과 같은 실용적인 기술도 절을 할애해 설명을 더했습니다.

 

주요 내용

  • 통계학 기본
  • 파이썬 기초와 주피터 노트북 설정
  • 기술통계
  • 확률과 확률분포
  • 통계적 추정과 가설검정
  • 통계모델
  • 정규선형모델과 일반화선형모델
  • 통계학과 머신러닝

'인생이란 우연이란 사건이 연속으로 이어져 만들어진 소설이다'

옛날 어느 소설에서 읽었던 내용의 글귀이다. (그대로 가져온 문구는 아님을 밝힘어찌 보면 인생은 우연즉 사건의 연속이 모여진 하나의 큰 사건일 수 있다

그렇다면 사건이란 무엇일까사건이란 어떠한 특정 상황이 일정한 확률로 발생하는 것을 의미한다여기서 의미하는 일정한 확률이란수많은 환경 변수들이 복잡하게 얽히고 설키어 종장에는 앞서 말한 특정한 상황이 야기하게 되는 그것을 의미한다.

그렇기에 이러한 사건확률을 다루는 통계학은 우리 인간사에 있어서 때려야 땔 수 없는 가장 실용적인 학문이라 할 수 있다.

더욱이 파이썬과 같은 고수준 언어 (스크립트)는 내장된 다양한 라이브러리를 통해서 통계학에 쉽게 다가갈 수 있는 다양한 방법을 개발자들 및 학습자들에게 제공하고 있다.

이제는 통계학의 기본적 이론만 알고 있다면파이썬의 모듈들을 활용하여 손쉽게 본인이 원하는 통계 프로그램혹은 통계 유틸을 만들 수 있는 시대가 도래한 것인 것이다.

본 서는 위에서 언급한 고수준 언어인 파이썬을 이용하여 실용학인 통계를 손쉽게 이해하고 직접 학습자로 하여금 학습할 수 있는 환경을 제공하고 있다.

그렇기에 프로그래밍 언어특히 파이썬과 관련하여 약간의 기초가 되는 지식과 통계에 관한 관심이 있다면 이 책을 꼭 학습해 보길 권한다.

【파이썬으로 배우는 통계학 교과서를 읽고 나서 】

필자가 고등학교를 다닐 시절에는 파이썬과 같은 언어가 없었기에 (솔직히 지금처럼 프로그래밍 자체가 대중화되어 있지도 않았다통계학을 배울 때는 카시오 계산기를 꺼내들고 내장된 함수들을 사용하여 계산을 하곤 했던 기억이 있다.

이제는 시대가 시대인지라 약간의 프로그래밍 지식만 갖추고 있다면손쉽게 본인에게 필요한 통계를 직접 프로그램으로 디자인하고 구현하여 실생활에 응용할 수 있다.

아는 만큼 세상이 편해지고아는 만큼 자신에게 이로운 것을 손쉽게 만들 수 있는 시대에 산다는 것은 어찌 보면 현대를 사는 우리에게 가장 큰 혜택이라 할 수 있겠다.

 

#본 도서는 "한빛미디어 <나는 리뷰어다활동을 위해서 책을 제공받아 작성된 서평입니다.

이번에 리뷰하게 된 책은 파이썬을 통해서 통계의 개념을 익히는 학습서인 '파이썬으로 배우는 통계학 교과서 2판'이다. 전공이 아닌 이상 통계학의 심오한 개념을 익히기엔 많은 어려움이 따른다. 하지만 이 책에서는 통계 수식과 파이썬 프로그래밍을 통해 통계학의 기본 바탕 지식과 이를 활용한 머신 러닝 심화과정까지 알려주기 때문에 머신러닝에 필요한 지식의 핵심을 빠르게 알 수 있다.

기술통계와 추론통계가 왜 필요한지 알려주는 통계학 기본 파트와 필요한 파이썬 라이브러리와 기본 함수를 알려주는 파트, 기본통계, 확률과 확률분포, 통계적 추정, 통계적 가설검정, 통계모델, 정규선형모델, 일반화선형모델, 통계학과 머신러닝파트로 이루어져있다.

책에서 알려주는 지식들은 예전부터 내려오는 통계학 지식이 아니라 현대에 들어서 사용되는 데이터 분석과 이에 따른 트렌드들을 아울러 설명해주는 통계학 지식들이라 실무에서 필요로 하는 통계학 지식들을 여러 예시를 통해 빠르게 배워볼 수 있다.

유의할 점은 통계 수식에 필요로 하는 기호들을 자세히 알려주지는 않기 때문에 수식 기호들만이라도 다른 곳을 통해 배우고 이 책을 본다면 이해가 훨씬 빠를 것이다. 빠르게 기본기를 다지고 싶은 데이터 관련 업무를 하는 분들에게 강력히 추천하고 싶다.

"한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."​

#나는리뷰어다 #한빛미디어 #바바신야 #파이썬 #통계학

'파이썬으로 배우는 통계학 교과서 2판'은 통계학의 기초부터 현대적 응용까지 포괄적으로 다루면서도, 실습과 이론의 균형을 잘 맞춘 교재와 같은 책(실제로 교재로 사용하지 않을까 싶습니다)입니다. 특히 파이썬으로 바로 실습해볼 수 있게 안내함으로써, 배운 내용을 즉시 출력해본다는 점이 큰 장점입니다. 데이터와 AI 시대를 살아가는 모든 이들에게 필수적인 통계적 사고를 기르는 데 있어 선물같은 책이라고 생각합니다.
한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

 

나에게 있어서 통계학은 뭐랄까, 살짝 트라우마 같은 존재이다. 학창 시절 남보다 매우 일찍 취업한 이유도 있었지만, 통계학 점수가 참 우스울 정도로 엉망이었기 때문이다. 그래도 그때는 크게 신경 쓰이진 않았다. 학점을 포기할 정도로 솔직히 지루하고 너무 재미없었다. 많은 데이터를 반복적으로 계산하는 것이 내 취향이 아니었다. 

 

통계의 중요성을 전혀 몰랐던 것이다. 그저 보험 수학 같은 것에 자주 쓰이고, 이걸 익히면, 보험이나 금융 쪽에 취업하기 좋다 정도였다. 당시 통계학을 가르쳐 주셨던 교수님께는 죄송하지만, 그때 통계의 비전, 컴퓨터에서의 활용을 보다 강조해서 알려줬다면, 나도 생각이 달라지지 않았을까 생각한다. 어쨌든 통계의 잠재적 가능성을 못 알아본 나의 창피한 핑계와 변명이다.  

 

지금 통계학의 위상은 엄청나다. 경제, 경영, 각종 과학 분야, 공학 등 모든 학문에서 통계는 필수가 되었으며, 인공지능 AI에서는 꼭 익혀야 할 기본 수학 파트가 되었다. 그러다 보니, 과거엔 비록 포기했던 통계학이었지만, 지금은 새로운 마음으로 틈틈이 다시 공부하고 있다. 

 

 

사람마다 다르겠지만, 통계는 난해함보다는 지루한 편이다. 공식도 비슷비슷해서 틀리기 쉽다. 무엇보다 통계학은 단순히 공식만 암기해서는 절대 안 되는 학문이다. 어떤 때 어떻게 활용하는지 제대로 알아야 하고, 흔히 발생할 수 있는 통계의 오류 같은 것들에 대한 지식도 필요하다. 빅데이터에서 사용하는 거처럼, 조사 범위, 데이터의 선별과 같이 자료를 제대로 다룰 수 있어야 한다. 이런 것들을 확실히 모르고 통계처리를 하게 되면, 전혀 다른 결과를 도출하게 될 수 있고, 실험 조작, 여론 조작, 잘못된 의사결정과 같은 심각한 문제를 만들 수 있다.

 

서론이 길어졌는데, 그만큼 통계는 제대로 배워야 한다는 소리다. 이번에 소개하는 바바 신야 저자의 '파이썬으로 배우는 통계학 교과서'는 책 제목 그대로 교과서와 같이 통계학의 가장 기초부터 머신러닝 응용까지 한 계단 한 계단 지식을 쌓게 도와주는 책이다.

 

 

더군다나, 통계가 현재 수많은 프로그램으로 다뤄지고 있는 만큼, 파이썬 언어 기초부터 익혀가며 바로 써먹을 수 있는 활용 방법도 함께 알려주고 있다. 뭐랄까 통계학과 파이썬, 두 마리 토끼를 한 번에 잡는 책이란 느낌이 강하다. 그래도 일단 파이썬을 전부터 쓰고 있는 내 입장에서는 통계를 얼마나 쉽고 잘 가르치고 있는지를 더 중요시하고 봤는데, 이 책이 그런 면에서 걸출하다. 설명이 장황하지 않으면서도 이해가 쏙쏙 되게 너무나 잘 설명하고 있다. 통계 예제마다 파이썬 코딩으로 확인하고 있어, 라이브러리 사용 연습에도 도움 된다.

 

 

보통 컴퓨터나 수학 관련 책에는 번역서가 아니더라도 주석이 많이 붙는 편인데, '파이썬으로 배우는 통계학 교과서'는 별다른 주석 없이도, 누구나 이해하기 쉽게 설명하고 있다. 이번 '파이썬으로 배우는 통계학 교과서'는 2판인데, 저자가 초보자가 쉽게 학습할 수 있도록 초판을 대폭 개정했다고 한다. 구성과 내용 보강을 했다고 한다. 그래서 더 이해가 쉬웠던 거 같다. 물론 윤웅식 옮긴이가 어색함 없이 자연스럽게 번역한 공도 클 것이다.

 

 

통계학을 처음 접한다면, 무조건 '파이썬으로 배우는 통계학 교과서' 챕터 1부터 보는 것이 올바른 학습 순서가 될 것이다. 챕터 1은 짧게 끝나지만, 통계학의 전반적인 의미와 주의할 점을 간결하게 잘 설명하고 있는 만큼 그냥 지나치지 말고 꼭 봐야 한다. 

 

챕터 2는 파이썬 프로그래밍 언어를 다룬다. 설치와 중요한 문법을 다룬다. 파이썬 언어가 워낙 많은 곳에서 쓰이고 있는 만큼, 아직 익히지 않았다면, 이참에 통계학과 함께 공부하면 앞으로 무척 유용할 것이다. 물론 이 책에서는 기본적이고, 통계에 필요한 것만 학습하므로 파이썬을 보다 전문적으로 익히기 위해서는 나중에 다른 책도 참고해야 할 것이다.

 

 

'파이썬으로 배우는 통계학 교과서'를 보면서 왜 이 책이 쉽게 느껴졌나 다시 곱씹어 보면, 챕터 1부터 마지막 챕터 10까지 다양한 비유와 예시를 통해 이해를 도왔기 때문이라 생각한다. 추론통계를 위한 빨간 구두, 파란 구두부터 평균값이 지닌 문제점을 말하고 있는 저축금액 예, 기술통계 전반적인 설명에 사용된 물고기 분류, 통계에 빠지지 않고 등장하는 동전, 날씨,  프라모델, 맥주 판매 등등 참 많은 것들을 활용했다. 그만큼 내용을 다시 떠올리는 데 도 도움이 됐다.

 

 

'파이썬으로 배우는 통계학 교과서' 챕터 1에서 6까지는 통계학 입문 내용을 다룬다. 중고등학교 수학 시간에 배운 것도 나오지만, 전반적으로 전산적인 시각에서 보고 있는 면이 있어, 다소 새롭게 느껴질 수 있다. 그러나 읽다 보면, 별거 아니네 하는 생각이 바로 들게 될 것이다. 시그마, 파이, 표준분포, 변동계수, 공분산, 상관행렬, 각종 그래프, 확률분포, 이항분포, 정규분포, 추정, 추출, 가설검정 등 모두 어려움 없이 이해할 수 있다.

 

 

챕터 7부터 10까지는 분석 방법을 다룬다. 통계모델부터 회귀분석, 분산분석, 가능도 같은 것이 나오며, 인공지능에 다양하게 활용되고 있는 선형모델, 선형분석도 배운다. 이 책에서 머신러닝 파트의 비중은 작지만, 기초는 확실히 닦을 수 있다. 어차피 머신러닝, 딥러닝, 신경망 이런 것들 깊게 익히려면, 책 한두 권으로는 안된다. 어쨌든 기초만 탄탄하다면, 다른 책을 보고 이해하는데도 큰 도움이 된다.

 

인공지능을 공부하면서, 내 수학 지식이 터무니없이 모자란다는 것을 절실히 깨달았다. 그러다 보니 모자란 수학 실력을 어떻게 보충할까 고민해왔다. 통계학의 경우 대학 때 봤던 교재를 다시 볼까도 생각했다. 그러나 그건 그다지 합리적인 방법이 아니다. 어차피 IT에 써먹으려고 하는 만큼, IT, 전산이 융합된 책이 보다 실용적일 것이다. 이번 '파이썬으로 배우는 통계학 교과서'를 통해서 통계학을 체계적으로 공부하는데 많은 도움이 됐다.  무엇보다 쉽게 이해할 수 있어서 참 좋았다. 역시 공부의 기본은 교과서 중심이다. 현재 파이썬과 통계학에 자신이 없다면, 이 책을 추천하고 싶다.

한빛미디어 <나는리뷰어다>에서 2판으로 새롭게 출간한 <파이썬으로 배우는 통계학 교과서(2판)> 리뷰어를 모집하여 신청해 읽어볼 기회를 얻었다. 통계학은 데이터 분석과 의사결정의 기초가 되는 중요한 학문이지만, 단순히 수식과 이론만으로 개념을 명확히 이해하기 어렵다. 이 책은 파이썬 실습을 통해 그런 한계를 극복할 수 있도록 돕는다.

이 책은 파이썬을 활용해 각종 통계 분석 과정을 직접 구현하고, 그 결과를 확인하며 통계학의 원리를 배우는 과정을 제공한다. 단순히 읽는 데서 그치지 않고 실습을 통해 이론과 실전을 동시에 경험할 수 있어 실용적이고 학습 효과가 뛰어나다. 특히, 파이썬 통계학에 관심 있는 초보자부터 실무적 활용을 고민하는 학습자까지 폭넓게 추천할 수 있는 책이다.


체계적인 목차 구성과 학습 과정
<파이썬으로 배우는 통계학 교과서(2판)>은 통계학의 전반적인 내용을 체계적으로 학습할 수 있도록 구성되어 있다. 초반부에서는 기술통계를 다루며 데이터를 요약하고 시각화하는 기법을 배운다. 기술통계는 데이터를 정리하고 핵심 정보를 도출하는 과정으로, 평균, 중앙값, 분산, 표준편차 등 주요 지표를 활용해 데이터를 명확히 이해할 수 있도록 돕는다. 이와 함께 그래프와 표를 활용한 시각화는 통계적 해석의 기초를 다지는 데 큰 도움이 된다.

중반부에서는 확률과 분포를 학습하며 데이터를 이해하고 예측하는 데 필요한 기본 개념을 다룬다. 확률은 불확실성을 다루는 통계 분석의 핵심 도구이고, 분포는 데이터의 패턴을 파악하고 적합한 분석 기법을 선택하는 데 중요한 역할을 한다. 이후, 추론통계와 가설검정을 통해 데이터를 활용해 모집단의 특성을 추정하거나 가설의 타당성을 검토하는 방법을 익힐 수 있다.

마지막으로 통계 모델과 선형 모델을 다루며 데이터 간의 관계를 정량적으로 설명하는 방법을 배운다. 통계 모델은 데이터를 구조화하여 현실 세계의 문제를 분석하고 예측하는 데 사용되며, 선형 모델은 변수 간 상관관계를 분석하는 기본 도구다. 이 과정에서 독자는 통계학의 기초부터 머신러닝 기초까지 폭넓은 학습을 경험할 수 있다.

이번 2판은 최신 파이썬 환경에 맞춰 개정되었다. 라이브러리 업데이트와 코드 수정이 이루어져, 독자가 실습 과정에서 겪을 수 있는 불편을 최소화했다. 또한 독자 피드백을 반영해 가독성을 높였으며, 최신 분석 도구를 활용해 학습 효과를 극대화할 수 있도록 구성되었다. 덕분에 파이썬 통계학을 배우고자 하는 초보자도 최신 환경에서 안정적으로 학습할 수 있다.

이 책은 통계학의 기본 개념을 배우는 동시에 파이썬 프로그래밍 기술을 익힐 수 있다는 점에서 두 가지를 동시에 배우고자 하는 사람들에게 최적적이자 효율적인 선택이라고 생각한다. 데이터가 중심이 되는 시대에 파이썬 통계학은 전공자가 아니더라도 알아두면 무조건 도움이 될 수 있는 소양이다. 이 책은 복잡한 이론을 쉽게 풀어주고 이를 실습으로 연결하며, 독자가 실제 데이터를 분석하고 문제를 해결할 수 있는 능력을 길러준다.

<파이썬으로 배우는 통계학 교과서(2판)>은 초보자부터 실무적 활용을 고민하는 학습자까지 폭넓게 추천할 수 있는 실용서로 보인다. 데이터 분석, 통계학, 그리고 파이썬 통계학에 관심 있는 분이라면 꼭 읽어볼 만한 책이라 추천하고 싶다.

한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

 

안녕하세요

이번에 서평 해볼 책은 한빛미디어에서 나온

파이썬으로 배우는 통계학 교과서 2판입니다.

보통 한빛미디어에서 나온 책들은 흰색 표지가 많았는데

이번에는 검은색에 다채로운 색감을 느낄 수 있는 표지로 나왔네요

 

책 내용은 제목 그대로입니다.

파이썬을 통해서 통계학을 배웁니다.

참고로 통계학 수준은 대학교 1 ~ 3학년 수준입니다.

제가 전공수업에서 배웠던 내용들이 다 담겨 있네요

통계학을 알려주고 그걸 파이썬으로 어떻게 활용하는지 알려줍니다.

 

예제 테스트 환경은 윈도우 10입니다. 라이브러리는 anaconda를 사용하고 파이썬은 3.11.7입니다.

예제 파일도 다운로드할 수 있습니다.

 

챕터는 총 10개로 구성이 되어있습니다.

목차는 굉장히 상세하게 나눠져있습니다.

그만큼 내용이 많기도 합니다.

 

책은 구성은 위와 같이 되어있습니다.

소제목으로 주제를 먼저 알려주고 바로 내용으로 들어갑니다.

중요한 내용이나 단어가 있으면 볼드체로 표시가 되어있습니다.

글로만 설명하기 어려운 부분들은 예시도 적절하게 들어가 있습니다.

 

2장에서는 파이썬 기초와 개발 환경 설치하는 법도 알려줍니다.

파이썬을 처음 접할 수도 있기에 파이썬 프로그래밍에서 자주 사용하는 용어도 알려줍니다.

주피터를 어떻게 사용하는지도 그림까지 보여줘서 알려줍니다.

파이썬도 이렇게 알려줍니다.

다만 아예 파이썬 기초가 없는 분이 보면 어려우실 것 같기도 합니다.

 

3장부터 본격적으로 통계가 시작이 됩니다.

통계의 기본인 데이터를 분류하는 법부터 배웁니다.

수식이 필요한 부분은 긴 설명과 함께 수식을 어떻게 사용하는지도 보여줍니다.

 

이제 개념을 배웠으면 바로 numpy, pandas를 이용해서

활용하는 법도 알려줍니다.

단순히 수식 활용법뿐만 아니라 도표 그리는 법도 상세히 알려줍니다.

 

4장에서는 확률과 확률론에 대해서 배웁니다.

확률이 무엇인지부터 시작해서 확률론을 공부하는 이유와

확률에 필요한 개념들을 배웁니다.

 

집합에 대해서도 배웁니다.

확률의 곱셈 정리, 독립, 확률분호, 이산형, 연속형 등등 확률에 필요한 개념들을 다 배웁니다.

 

확률에서 중요한 부분 중 하나인 통계적 가설검정도 있습니다.

통계적 가설검정에서 필요한 용어부터 자세하게 정리를 하고

어떤 식으로 가설검정을 해야 되는지를 알려줍니다

 

9장에서는 푸아송분포, 지수형 분포 등 어려운 분포에 대해서도 배웁니다.

10장 마지막에서는 통계학과 머신러닝을 배웁니다.

정규화, 리지 회구, 라소 회귀 등을 배우고 어떻게 머신러닝에 활용하는지도 배웁니다.

 

이 책을 통해서 공부하면 통계의 기초부터 고급 내용까지 배울 수 있고

대학교 1 ~ 3학년 수준의 통계 지식을 얻을 수 있다고 생각이 듭니다.

또한 단순히 통계학 뿐만 아니라 파이썬을 통해서 어떻게 통계학을 적용할 수 있는 지도 배울 수 있는

좋은 책이라고 생각이 듭니다.

 

파이썬과 통계학을 동시에 배우고 싶으신 분들한테 추천합니다.

 

"한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 몇년전만 해도 통계학이란 주제의 도서는 보통 자연과학 분야에 많이 있었는데, 이제는 컴퓨터/IT 분야에서도 많이 볼 수 있을만큼 본래의 주제에서 확장된 다른 영역에서도 통계학을 다루고 있다. 또한 뭔가 어려운 주제인 것처럼 여겨지고 딱딱한 내용들만 담겨져 있던 내용에서 최근에는 비전공자들도 쉽게 이해하고 다룰 수 있도록 실습형 책들도 많이 소개되고 있다. 특히 파이썬으로 구현되어 있는 통계 패키지 구현체는 기존의 통계언어인 R보다도 접근하기 쉽고, 더 응용할 수 있는 범주가 넓어져 관련 내용을 이해하고 다루는데 도움이 되었을 듯 하다. 물론 시중에 파이썬으로 진행하는 통계 관련 서적들이 많이 출간되어 있지만, 이번에 2판으로 출간된 책을 읽어볼 기회가 있어 책을 소개해보고자 한다.

 

파이썬으로 배우는 통계학 교과서 2판

 

이번 포스트에서 소개하는 "파이썬으로 배우는 통계학 교과서 (2판)"은 19년에 출간했던 1판에서 기술통계나 추론통계 관련 실습 내용이 추가되면서 분량이 1.5배 정도 증가하였다. 사실 이전판도 좋기 했지만 뭔가 교과서라고 하기에는 파이썬에 대한 내용과 통계의 이해에 필요한 모델에 대해서만 소개되어 있어, 그냥 살펴보고 넘어갔던 기억이 어렴풋하게 남아있는데, 이번 책은 조금 부족한 부분이 실습으로 보완되고, 이론적으로도 분량이 보완되었다. 특히 이론적인 부분이 많이 보강되어서, 뭔가 통계에 대한 기본 레퍼런스를 찾는 사람에게도 유용할 것 같았다.

 앞에서도 소개했다시피 파이썬의 강점이라면, 쉽게 접근할 수 있는 언어이면서 통계 관련 이론적인 내용이 잘 패키지화되어 있고, 특히 다른 영역과 접목시키기도 좋다는 점일텐데, 사실 그 부분을 잘 확인해볼 수 있는 부분이 시각화 부분이 아닐까 생각한다. 역시 이 책에서도 구현한 내용이나 통계적 이론에 대한 시각화 자료를 matplotlib이나 seaborn 등으로 표현하는 과정이 잘 설명되어 있다. 그래서 주어진 예제마다 통계치 확인 후, 결과를 확인해볼 수 있는 시각화 그림을 그려볼 수 있도록 구성되어 있으며, 여기까지 오면 아마 통계를 공부한 사람이라면 교과서에서 봄직한 그림들을 직접 그려볼 수 있을 것이다.

 가장 기본기가 될만한 내용이 잘 서술되어 있기 때문에 여타 파이썬 통계 관련 책들과 비교했을 때 그렇게 부족한 부분이 보이지 않는다. (굳이 한가지 짚자면, 어쩔수 없는 한계였겠지만, 통계 용어가 너무 일본식 단어를 풀어서 쓴 느낌이 있어, 영어단어라도 같이 표현을 해놓았으면 더 좋을 것 같다는 생각이 든다.)  그래도 간단한 예제를 통해서 내용을 이해하고, 현재의 문제에 적용해볼 수 있는 능력을 기를 수 있는 책이기에 그런 저자의 의도에 맞는 내용이 잘 서술된 책이라고 생각된다.

 

(해당 포스트에서 소개하고 있는 "파이썬으로 배우는 통계학 교과서 2판" 책은 한빛미디어로부터 제공받았음을 알려드립니다.)

출처: https://talkingaboutme.tistory.com/entry/Book-statistic-reference-with-python-2nd [자신에 대한 고찰:티스토리]

이 책은 복잡한 수학적 배경 없이 파이썬을 이용한 실용적인 코드 예시를 통해 개념을 설명하며, 점차적으로 독자가 이해할 수 있도록 돕는다. 기본 개념을 다루고, 파이썬 코드로 실습하는 방식으로 구성되어 있어, 이론을 실습을 통해 이해할 수 있게 한다. 파이썬이 익숙한 사람이라면, 통계학 입문을 이 책으로 시작해 보는 것도 괜찮다고 생각한다. 통계학을 입문하기에는 충분히 도움이 되는 책이라고 생각한다.

 

특히, 데이터 분석에서 필요한 기초 통계에 대한 개념을 파이썬 코드 실습을 통해 다시 한 번 익혀보는 시간을 갖는다는 점은,  책의 최종장인 통계학과 머신러닝을 연결 짓는 부분에서 볼 수 있듯  책의 강점이라 생각한다. 책의 흐름이 자연스럽고, 독자가 데이터 분석 및 머신러닝의 기초를 시작할 기회를 제공한다는 점에서 좋은 책이라 생각한다.

 

한빛미디어 서평단 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.



전체적으로 초보자도 이해하기 쉽도록 구성된 책입니다. 파이썬은 아는데 통계를 모르거나, 통계는 알지만 파이썬을 잘 다룰 줄 모르시는 분들께도 추천드립니다.

저는 공모전 준비하며 잠깐씩 썼던 내용이 나와 꽤 반가웠던 것 같습니다. 책에서는 기초적인 통계부터 데이터마이닝에 사용하는 부분까지도 실습이 나와있습니다.

제 생각에 통계학과 친숙한 분들 중 R로 통계프로그래밍/회귀분석 정도를 다루어보셨다면,

더욱 이해하기 쉬울 것 같습니다.

 

"한빛미디어 서평단 < 나는리뷰어다 > 활동을 위해서 책을 제공받아 작성된 서평입니다."



 

 불과 몇년 전까지만 하더라도 통계하면 SPSS, SAS를 활용해야 했다. 그러나 현재는 파이썬 또한 통계를 수행할 수 있는 솔루션으로 자리매김하고 있다. <파이썬으로 배우는 통계학 교과서>는 통계학과 통계를 수행함에 있어 필요한 파이썬 기술을 설명한다. 책은 다음과 같은 세가지를 주요하게 설명한다.

 

  1. 데이터는 어떻게 분석하는가
  2. 왜 그렇게 분석하는 게 좋은가
  3. 파이썬을 사용해서 어떻게 분석하는가

 

 긴밀한 관계의 두 이론을 동시에 배우고 싶은 이들이 펼치면 좋을 책이다. 각 장이 세분화 되어 있어 각각의 개요를 간략하게 설명하고자 한다. 우선, 1장은 통계학의 의의로 시작한다. 2장은 파이썬을 소개한다. 파이썬 설치 방법과 주피터 노트북 사용법을 설명하고 파이썬의 기본 문법 및 주요 라이브러리(주로 numpy, pandas)를 실습한다. 3장부터는 통계학의 개론에 대해 설명한다. 기술통계, 추론 통계와 같은 기본 개론들이다. 그 이후 7장부터 10장까지는 회귀 분석과 분산분석과 같은 분석 방법을 통합적으로 다룰 수 있는 통계 모델에 대해 설명한다.

 

 저자는 대상 독자로 통계학을 처음 배우는 사람이나 통계학 공부를 포기했다가 다시 도전하고자 하는 사람을 꼽았다. 이러한 집필 의도로 인해 아주 기초적인 설명으로 시작한다. 또, 입문자가 보기에 자칫 어려울 수 있는 용어들 또한 쉽게 풀이 되어 기존 통계 공부에 대한 어려움을 덜 수 있다.


 1장은 통계학의 사전적 정의와 그 당위성에 대해 소개한다. 통계는 기술통계와 추론통계로 크게 두 가지 범주로 나뉜다. 기술통계는 가지고 있는 데이터를 정리하고 요약하는 데 사용하는 통계학의 분야이다. 추론통계는 갖고 있지 않은 미지의 데이터를 추측하는 통계학의 분야이다. 이러한 사전적 정의는 여전히 우리에게 모호하게 느껴진다. 기술통계와 추론통계도 각각의 세부 통계 방법이 있어 천천히 학습해나갈 것이다. 도수분포, 층화분석, 상관분석에 속하는 기술통계의 세부 속성들을 이해하고 나면 상위 속성인 기술 통계의 정의도 뚜렷해질 것이다. 통계를 수행하기 위해서는 각 주제의 목적에 부합한 방법을 적용해야 한다. 그렇기에 막연히 파이썬으로 분석 기술을 배우는 것보다는 통계적 이론을 배우는 것이 훨씬 도움이 되리라 확신했다.

 

2장에서는 파이썬의 기본 용어와 문법에 대해 소개된다. 통계뿐만 아니라 파이썬에 대해서도 기초부터 차근차근 설명이 제공된다. 이 책에서는 윈도우에서 파이썬을 실행하였기에 윈도우를 기준으로 과정을 서술한다.


뒷장에서부터는 기술통계 및 추론통계에 대한 세부적인 이론과 실습과정을 설명한다. 이론을 설명한 뒤 주피터 노트북에서 파이썬을 실행하여 실습하는 방식이다. 통계와 파이썬을 한 번에 배울 수 있어 두 기술을 접목하는 것이 훨씬 수월하게 느껴졌다.

 

종합 평가
1. 통계학 및 파이썬 입문 - 이론과 용어 풀이가 상세히 설명되어 이해도가 높아졌다.
2. 통계학 이론 학습 후 파이썬 실습 수행 - 두 기술을 접목하여 동시에 학습함으로써 체득하는데 용이했다.
3. 통계학 개론 - 통계 목적에 부합하는 분석 방법을 진행할 수 있다.

 

 

 

 

 

    "한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

 

다들 연말을 잘 보내고 계실까요?
2024년의 마지막 달에 한빛미디어에서 보내주신 책은
파이썬과 통계학을 모두 잡을 수 있는 한 권을 보내주셨습니다.
파이썬으로 배우는 통계학 교과서가 2판으로 따끈따끈하게 출시됐습니다!

기존의 파이썬으로 배우는 통계학 교과서 초판과 비교하자면
초보자가 보다 쉽게 통계학을 학습할 수 있도록
구현 순서를 하나씩 따라가며 해설하고 있습니다.

1판은 2019년에 발간되었기 때문에 2025년을 앞둔 지금
코드를 실행할 때 변경된 부분이 많을 것 역시 예상됩니다.
파이썬 실습 코드를 최신 버전으로 점검 및 수정하는 것도 빼먹지 않았습니다.

추가적으로, 통계 기법의 종류 중 데이터사이언스의 근간이 되는
기술통계와 추론통계 등에 대한 실습량을 늘리고
저자가 데이터를 다루는 데 매우 중요하다 생각하는 것들,
예를 들면 층화분석, 도수분표, 분산분석 등에 대한 설명을 강화했습니다.


챕터 1에서는 통계학의 기본에 대해 이해하는 시간을 갖습니다.
통계학이 무엇인지, 그리고 통계학에는 기술통계와 추론통계가 있는데,
왜 기술통계와 추론통계가 필요한지에 대해 고민합니다.

챕터 2는 파이썬으로 통계학을 배우기 위해서,
파이썬 환경 구축과 주피터 노트북을 설치하고
파이썬의 기초 문법, 넘파이와 판다스에 대해 알아봅니다.

챕터 3부터 본격적인 통계학을 다루고 있습니다.
먼저 기술통계를 다루게 되는데, 통계적 시각으로 수식을 읽는 방법을 정립하고
도수분포, 1변량 통계와 다변량 통계, 층화 분석이 무엇인지를 배운 후 그래프를 활용해 구현하고자 합니다.

챕터 4는 확률과 확률 분포입니다.
제가 학생때는 필수로 고등학교에서 확률과 분포라는 과목 하에 배운 내용들을 다루고 있는데,
확률론, 즉 확률로 수치를 표현하는 것에 대한 이론,
확률 분포, 이항 분포, 정규 분포 등 확률로 나타낼 수 있는 분포에 대해 그 방법과 원리를 학습합니다.

챕터 5에서는 통계적 추정이 무엇인지 학습합니다.
통계적으로 무언가를 추정하고 추론한다는 것의 의미를 이해하기가
생각보다 어렵다고 생각하는데, 이 모호한 개념을 책에서는 이해하기 쉽게 말로 풀어 설명하고 있습니다.

모집단에서 표본 추출하는 과정을 시뮬레이션해보고, 
모평균 및 모분산을 추정하며
정규 모집단에서 파생된 확률 분포를 그려보기도 하며 구간 추정의 개념도 다뤄봅니다.

챕터 6은 통계적 가설 검정입니다.
통계학, 데이터사이언스, 사회복지 등을 전공하셨더라면 들어보셨을 t검정 등이 여기에 속합니다.
모평균에 대한 단일 표본 t검정, 평균값 차이의 검정, 분할표 검정에 대해 알아보고
검정 결과를 어떻게 해석하는 지를 배울 수 있는데, 이 부분이 중요한 것 같습니다.

검정에 대해 어느정도 이해했다면, 
이제 실제로 파이썬에서 다룰 수 있는 통계 모델을 챕터 7에서 다뤄봅니다.
선형(linear) 모델이 무엇인지, 어떻게 만드는지 원리를 이해하고
데이터는 선형 모델에서 어떻게 표현하는지, 모델에는 무엇이 있는지도 학습한 다음
파라미터를 추정하는 두 가지 방법을 다루고 있습니다.

최대 우도화라고도 불리는 가능도 최대화(maximum likelihood method)는
어떤 확률변수에서 표집한 값을 토대로 확률변수의 모수를 구하는 방법이 있고,
다른 방법은 모델의 예측값과 실제 관측값 사이의 차이를 최소화하여 파라미터를 추정하는
손실 최소화 방식도 다뤄봅니다.
다양한 방법으로 파라미터를 추정해보고, 예측 정확도를 평가해보고
가장 우수한 정확도를 출력한 파라미터를 선택하는 플로우로 학습해봅니다.

챕터 8에서는 각각 정규 선형모델을 다룹니다.
연속형 독립 변수가 하나인 경우에는 단순회귀를 사용하지요?
단순 회귀, 정규 선형 모델의 평가, 독립 변수가 여럿인 모델을 파이썬으로 구현해봅니다.
특히 이 과정에서는 소스 코드를 책에서 그대로 보여주고 있고,
이 코드를 github에서 손쉽게 접근이 가능합니다.

일반화 선형 모델을 다루는 챕터 9에서는
일반화 선형 모델이 무엇인지 기본 개념을 우선적으로 다룹니다.
이름이 다소 생소하실 수 있는데, 로지스틱 회귀가 가장 대표적인 그 예입니다.
일반화선형모델은 어떻게 모델을 평가하는 지, 그리고 푸아송 회귀를 추가적으로 학습합니다.

본 책의 마지막 챕터에서는 통계학과 머신러닝을 연결지어
머신러닝의 개념을 정확히 이해하고,
정규화와 리지 회귀, 라소 회귀의 정의를 다루고 있습니다.
그리고 이 통계적 개념을 파이썬에서 어떻게 구현해낼지를
코드 한 줄 한 줄씩 따라가며 설명해주고 있습니다.
마지막으로, 선형모델과 신경망의 개념을 연결지어
파이썬으로 신경망 모델을 구현하는 것까지 학습하게 됩니다.

본 책 
파이썬으로 배우는 통계학 교과서는,
파이썬으로 구현해봄직한 통계학 개념의 범위를 매우 넓게 커버하고 있습니다.
통계에 대한 세부적인 팁보다는 통계적 용어, 기본 수식, 파이썬으로 구현하기에 집중하여
통계학 기초를 파이썬 기반으로 다지기 위해 작성된 책입니다.
본 책에 대해 가장 큰 장점이라 생각하는 것은
같은 내용을 글 -> 수식 -> 파이썬 코드로 설명하기 때문에
자칫 모호하거나 오해할 수 있는 추상적인 통계학 개념을
점차 깊이 있기 이해하고, 와닿을 수 있도록 신경쓴 것이 많이 느껴졌습니다.

통계를 모르는 개발자 분들께서 통계학적 개념을 쌓고 싶으시거나,
파이썬을 배우신 지 오래 되지는 않았지만 통계학에 대한 개념도 같이 가져가고 싶으신 분들께 추천합니다.

한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

파이썬으로 배우는 통계학 교과서

안녕하세요. 율리시스SS입니다.
오늘 소개시켜드릴 도서는 '파이썬으로 배우는 통계학 교과서'입니다.
파이썬은 정말 다양한곳에 사용됩니다. 특히나 대학원에서는 빅데이터 등의 데이터를 가지고 파이썬으로 빠르게 계산하거나 통계를 하거나 머신러닝을 하기도 하는 만큼 중요한 언어인데요. 해당 도서는 파이썬으로 통계학을 공부할 수 있는 도서 입니다.
인터넷의 발전으로 수많은 데이터가 초당 어마어마하게 쌓이고 있는 시대 인데요. 다양한 데이터에 대해서 통계를 통해 데이터에 대한 통계를 좀 더 쉽게 배울 수 있는 도서입니다.

 

 


통계학의 입문서 성격을 띄며, 기술통계, 확률과 분포의 기본, 통계적 추정 및 통게적 가설검정을 다루며 이후 회귀분석과 분산분석같은 분석 및 통계에 대해서 자세히 배울 수 있는 도서입니다. 또한 예측 기술의 통계로 머신러닝과 접점을 다루어 통계학의 기초부터 흐름을 이애할 수 있도록 구성이 되어 있는데요. 통계학이 어렵게 느껴지는 이유중 하나인 이해할것이 너무 많다는 것인데 최대한 연결 관계를 파악하며 쉽게 집필했다는 점도포인트 입니다.

단지 파이썬에 대해서 기초적인 연산만 알려주기 때문에 좀 더 자세한 함수 등은 파이썬 언어를 직접 공부하시는것을 추천드립니다.
파이썬 주피터를 사용하며 아나콘다 프롬프트를 사용합니다.

 

 

챕터3부터 본격적으로 통계에 대한 학습이 시작되는데요.기술통계에서는 데이터 분류, 수식을 읽는 방법, 도수 분포, 1변량 데이터 통계량, 다변량 데이터 통계량, 층화분석 등 기본적인 통계에 대해서 학습이 가능합니다. 전체적으로 In, Out에 대해서 명확하게 알려주어 보기 편하며 통계에 대해서는 그래프 등 사진이 중요하기 때문에 이해하기 편하게 사진이 많습니다. 제가 통계쪽의 개발자는 아니지만 대학교때 파이썬과 주피터로 통계에 대해서 실습한적이 있는데 빅데이터의 세상에서는 통계가 무엇보다 중요하다고 느꼈는데 다시 파이썬으로 통계에 대한 도서를 읽다 보니 대학교때의 기억이 새록새록 나는것을 느꼈습니다.
요즘에는 빅데이터 테스트 용으로 다양한 사이트에서 샘플 데이터를 무료로 제공하는 사이트도 있으며 빅데이터에 대해서 통계를 하는 직업이신 분들은 파이썬이 빅데이터 처리 및 통계를 쉽게 또는 예제가 많아서 파이썬 언어를 추천드립니다.

 

 

통계학을 대학교때 배우고 나서 지금 다시 책을 접하려고 보니까 처음에는 굉장히 어려웠지만 책의 설명이 쉽게 작성되어 크게 어렵지만은 않았습니다. 데이터를 다루는데 중요한 기술과 아이디어에 대한 설명이 2판에서는 강화되어 괜찮았는데요.
이론부터 학습 후 통계와 관련된 용어도 설명해주기 때문에 초보자분들도 어느정도는 쉽게 학습이 가능할것으로 예상됩니다.
단지 파이썬은 조금 알고 해당 도서를 읽는것을 추천드리며 완전 파이썬을 모르신다면 파이썬 언어는 간단하게 배우고 오는것을 추천드립니다. 실제 데이터를 다루면서 통계 이론과 실습을 배우고 싶으신 분들, 통계가 어려웠던 분들은 파이썬으로 통계를 학습하는 도서중 괜찮은 도서라고 생각됩니다.

 

 

 

 

파이썬으로 배우는 통계학 교과서 2판 

- 쉽고 자세한 통계학 교과서의 정석 -

 

이번에 소개할 책은 "파이썬으로 배우는 통계학 교과서 2판"입니다.

데이터 분석을 공부하면서 꼭 넘어야 할 산 두 가지는 수학과 통계학 입니다.

특히 통계학은 데이터 전처리부터 EDA(탐색적 데이터 분석), 변수 선택, 파생 변수 생성, 회귀, 분류 알고리즘을 이해하는데 있어서 빠짐없이 들어가기 때문에 꼭 넘어야 할 산입니다.

저도 데이터분석을 공부하면서 여러 권의 통계학 책을 공부했었는데요. 항상 통계를 공부하면서 딱 이거다!! 하는 책은 없었습니다. 쉬운 책은 너무 쉽고 기초적인 내용만 나와있고, 쉬운 책이 아닌 다른 책들은 통계학 전공자들이 볼 것 같이 복잡한 내용이 너무 많아서 딱 중간 레벨의 책을 찾기가 너무 어려웠습니다.

그리고 통계학 책을 검색하면 대부분은 excel, spss, R 을 사용하는 책이 많고 python이 나온다고 해도 R 위주의 책에 python이 조금 추가되어 있거나, 코드가 R, python이 병기 되어 있는 경우가 많고, 순수하게 파이썬으로만 되어 있는 책은 그리 많지 않았습니다.

그런데 이번에 소개하는 책 "파이썬으로 배우는 통계학 교과서 2판"을 보니 내용이 너무 좋더군요. 기초부터 차근차근 잘 설명해 주는데 기초에만 머무는 것이 아니라 중급 이상까지 소개하고 더군다나 코드는 모두 파이썬으로 구현되어 있고, 머신러닝 알고리즘과도 이어져서 데이터 분석을 공부하면서 통계를 같이 공부해야 하는 사람들에게 너무나 좋은 책이 었습니다.  나름 통계학 책을 많이 찾아봤었는데 왜 이 책을 지금까지 몰랐을까? 하는 생각이 절로 드는 책이었습니다.

그리고 이 책이 정말 마음에 들었던 점이 있는데, 그것은 통계 계산을 할 수 있는 라이브러리별 차이점과 같은 결과를 얻기 위해서 필요한 조치에 대해서 자세히 설명해 주고 있다는 점이었습니다.

파이썬에 있는 여러 라이브러리를 이용하면 통계 계산을 할 수 있는데 라이브러리별로 구현되어 있는 내용이 달라서 같은 작업을 해도 결과가 조금씩 다르게 나옵니다. 

위의 내용은 책의 내용을 일부 캡쳐한 것인데요. 데이터 분석시 가장 많이 사용하는 pandas와 numpy에서 분산을 구하는 var함수가 어떻게 다르게 구현되어 있고, 어떻게 하면 같은 값을 얻을 수 있는지를 자세하게 설명해주고 있습니다.

 

scipy 라이브러리에서도 표본 분산과 불편분산을 사용할 때 어떻게 다르게 써야 하는지도 자세하게 나옵니다.

데이터 분석을 할 때 정확한 분석을 위해서는 다양한 통계 함수를 정확하게 사용해야 하는데요. 이 책에서 라이브러리별로 통계 계산을 할 때 어떻게 구분해서 해야하는지 자세하게 설명하고 있어서 아주 유용했습니다.

저는 이런 내용이 이 책의 가장 큰 장점이라고 생각합니다.

"파이썬으로 배우는 통계학 교과서 2판" 은 기초 통계부터 확률 통계, 통계적 추정, 통계 모델, 정규 선형모델, 일반화 선형 모델, 머신 러닝, 딥러닝까지 순차적으로 다루고 있습니다. 특히 머신러닝과 딥러닝 부분에서는 정규화 모델인 L1, L2 에 대해서 자세히 설명하고 있습니다.

간략히 위의 내용을 정리하자면

"파이썬으로 배우는 통계학 교과서 2판" 은 통계의 기초부터 중급까지 데이터 분석에 필요한 통계지식을 쉽고 자세하게 그리고 파이썬만 사용해서 설명하고 구현하고 있습니다.

내용이 쉽고 자세한 것은 물론이고, 자주 사용하는 통계 분석이 가능한 라이브러리들에 구현되어 있는 함수들이 어떻게 다르고, 같은 결과를 얻기 위해서 어떻게 사용해야 하는지 자세히 설명하고 있다는 점은 매우 큰 장점이고 다른 책들과 큰 차별점이라고 생각합니다.

데이터 분석을 공부하면서 통계를 같이 공부하려는 분들께 강력히 추천합니다.

"한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

통계학을 배우려는 사람들에게 가장 큰 장벽은 "어디서부터 시작해야 할지 모르겠다"는 막연함일 것이다.

'파이썬으로 배우는 통계학 교과서'는 통계 수식과 파이썬 코드라는 두 가지 도구를 활용해 통계학의 기초부터 머신러닝 응용까지 자연스럽게 이어주는 구성인데, 처음 통계를 배우는 사람들에게도 부담 없이 접근할 수 있게 만들어 준다.

통계학은 단순히 수식과 개념을 배우는 것을 넘어, 데이터를 다루고 분석하며 현실 문제를 해결하는 데 활용되는 학문인데, 이 책은 그런 점에서 이론과 실습의 균형을 훌륭하게 잡아준다. 파이썬을 기반으로 한 실습 예제가 풍부해서, 단순히 "통계란 무엇인가"를 배우는 데 그치지 않고 "이것을 어떻게 쓸 것인가"를 자연스럽게 익힐 수 있도록 구성되어 있다. 책의 구성이 초보자도 쉽게 따라갈 수 있도록 점진적으로 난이도를 높이는 방식이라 부담 없이 읽어나갈 수 있었다. 통계학에 필요한 수학적인 개념이 나오더라도 너무 어렵게 설명하지 않고, 파이썬 코드와 실제 데이터 활용을 통해 직관적으로 이해할 수 있게 해주는 점이 매력적이었다. 특히, 이론에서 끝나는 것이 아니라 데이터를 직접 다뤄보며 실질적인 통찰을 얻을 수 있는 실습 중심의 접근법은 큰 장점이다.

무엇보다 좋았던 점은 단순히 통계학 개념을 배우는 데서 멈추지 않고, 현대 데이터 분석과 머신러닝 트렌드까지 다뤄준다는 점이다. 이는 통계학이 과거의 학문이 아니라, 여전히 활발히 발전하고 있는 도구라는 걸 잘 보여준다. 마지막 장에서 선형 모델과 신경망을 연결하며 통계학과 머신러닝 간의 관계를 설명하는 부분은 특히 흥미로웠다. 이런 흐름 덕분에 학문적인 이해와 실무적인 활용이라는 측면에서 유용하게 읽었다.

이 책은 통계를 처음 배우는 대학생, 데이터를 다루고 싶지만 통계가 낯선 직장인, 또는 파이썬을 활용해 데이터 분석의 기본기를 다지고자 하는 사람들에게 추천한다. 딱딱하고 어렵게 느껴질 수 있는 통계학을 파이썬이라는 친숙한 도구와 함께 배우면서, 실용적인 통찰력을 얻을 수 있을것이다. "데이터 분석에서 머신러닝까지" 기초부터 실전까지 통계학의 흐름을 체계적으로 이해하고 싶은 사람에게 최고의 입문서가 될 것이다.

P.S.

개인적인 경험을 덧붙이자면, 학교 다닐 때 나는 수학을 좋아했지만, 통계는 지루하고 흥미롭지 않게 느껴졌다. 평균, 분산 같은 개념들이 단순히 공식을 외워 문제를 푸는 작업처럼 보였고, 데이터를 추정하거나 검정하는 이유도 이해하기 어려웠다. 그러나 프로그래밍을 배우며 통계를 새롭게 보게 되었다. 파이썬과 R 같은 도구를 통해 데이터를 분석하고 시각화하며, 통계적 개념들이 현실 문제를 해결하는 데 얼마나 유용한지 깨달았다. 통계는 단순히 숫자를 다루는 학문이 아니라 데이터를 통해 세상을 이해하고 미래를 예측하는 도구였다. 이제는 프로그래밍과 통계의 시너지가 수학적 아름다움만큼이나 매력적임을 느끼며, 통계가 흥미롭고 실용적인 학문임을 자신 있게 말할 수 있다.

 

"한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

안그래도 요즘 Data를 다룰 일이 많아서
머신러닝 data 이론을 공부하고 있는데요
결국 통계학과 확률이론
데이터 모데링을 공부해야 합니다. 피할 수 없어요​

꼭 필요한 것만 부분부분 읽어 그 순간 써야하는 함수나 이론을 이해만 하고 넘어갔는 데 통계학을 전반적으로 한번 살펴보고 내가 어느 부분에서 발췌해 쓰고 있다라는 개념을 가져보고자 책을 집어들었습니다.

물론 한권의 책을 읽는다고 바로 달라지는 것은 없겠지만
모든일에는 시작이 있겠죠

통계학 입문서
"파이썬 함수로 이해하는 통계학!"
그리고 이 책은 현재 2판입니다.
그만큼 널리 읽혀졌다는 반증같습니다.

특히 초판이 아닌데 정말 고마운 점은 파이썬 실습코드 점검 및 수정을 해줬다는 것
, 이거 당연한 것 같은 데 은근히 안되는 부분입니다.

과거에 쓰여진 책이 현재 버젼에서 되지 않아 코드 실행부분에서 자꾸 막히면
찾아보고 수정하며 실력향상이 될 수도 있지만
책을 읽는 속도가 더뎌지고 흥미가 떨어질 수 있습니다.
일단 기초적인 이론을 설명하고 파이썬으로 실습한다​

이 간단한 기본 구조를 따르고 있습니다.
주로 세가지 관점에서 설명합니다.

데이터는 어떻게 분석하는가
데이터는 어떻게 분석하는가
왜 그렇게 분석하는 게 좋은 가

파이썬을 사용해서 어떻게 분석하는 가
보통 왜가 빠져있는 데 그 부분을 설명해주니 초보자에게 굉장한 이점으로 다가옵니다.
항상 초반 몇 챕터를 공부하다 놔버렸던 통계학 공부
이번엔 다시 학생으로 돌아간 마음으로 밑줄 쳐가며 하나하나
이론들 꼼꼼히 살펴봤습니다.

전체적으로 빠르게 개념만 익힌다기 보다는
각 챕터별로 이론이라도 확실하게 읽어보시길 권장드립니다.
특히 비슷한 단어와 같은 단어라도 뜻이 다른 경우가 있으니 기억이 안나면 앞부분으로 다시 넘겨가며 정독했습니다.
제가 지금 회사에서 할려고 하는 일도 확률모델을 만드는 것
머신러닝으로 회귀모델을 만드는 것입니다.

역시 언젠가 쓰일 이론과 기술이 아니라 바로 실무에 접해야하는 것이다 보니 더 집중하며 읽을 수 밖에 없었어요
이론을 읽어보고 수식을 이해하고 파이썬으로 구현하며 확인해봅니다.

수식은 기호들이 낯설어 다시 찾아보며 최대한 이해해보려고 노력했습니다.

그리고 파이썬으로 시뮬레이션을 해보니 직관적으로 이해하는 데 도움이 되드라구요
행여 파이썬을 아직 다 배우지 못했다 코딩에 대한 두려움이 있다라고 생각하신다면 전혀 걱정하실 필요가 없습니다.

코딩 자체는 아주 간단한 수준이며 파이썬 코드의 기본만 아시면

충분히 실습해볼 수 있습니다.
오히려 수식의  이해가 허허....
조금 어려울 수 있어요

저자도 어려우면 중간과정은 무시하고 결과만 살펴봐도 괜찮다고 하십니다만
정규분포 확률밀도함수라 다 비슷한 함수의 변형입니다.
이런분에게 추천합니다.

파이썬 기초지식은 있지만 통계는 잘 모르는 분,
파이선이 익숙하지 않지만 통계를 공부해보려는 분,
통계가 어려줘 포기했다지만 다시 도전하고자 하는 분​

저는 제조 공정에서 공정별로 나오는 데이터의 상관관계와 데이터 회귀
그리고 통계를 내보려고 책을 잡았습니다.

누구나 학습서적을 선택할 때 목적이 있겠지만
최근 머신러닝이나 딥러닝에 파이썬이 많이 사용되고 있고
데이터를 처리하는 데 파이썬을 이용한 통계학 공부는 관련 분야를 공부하는
학생이나 실제로 써보려는 현장의 엔지니어들에게
항상 통용될 것 같은 기본 서적입니다.

언젠가 raw data를 받았을 때 이건 이런 이론으로 이렇게 분석해보자 하고 바로 아이디어가 떠오를 날을 그려보며 사무실 책장 한켠에 비취해두려고 합니다.

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원 무료배송
닫기

리뷰쓰기

닫기
* 상품명 :
파이썬으로 배우는 통계학 교과서(2판)
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
파이썬으로 배우는 통계학 교과서(2판)
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
파이썬으로 배우는 통계학 교과서(2판)
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실

최근 본 상품1