Mathematics/[Harvard] Statistics 110

Lecture 1: Probability and Counting

dotz0ver 2025. 7. 10. 22:37

  본 글은 Harvard Univ. Statistics 110: Probability 강의 "Lecture 1: 확률과 셈 원리 (Probability and Counting)"를 바탕으로 정리한 내용입니다.

📌 강의 영상: YouTube

📄 강의 슬라이드: PDF 링크


표본공간(Sample Space, S)

어떤 실험의 모든 가능한 결과의 집합

 

사건(Event, A)

표본공간의 부분 집합

 

확률의 naive definition

\[
P(A) = \frac{\text{A 사건이 일어나는 경우의 수}}{\text{전체 가능한 경우의 수}}
\]

> 단, 이 정의는 모든 결과가 같은 확률로 나올 것이라는 균등성(symmetric) 가정을 기반으로 한다.  
> 무한한 결과(예: 실수)일 경우에는 이 정의가 의미를 잃으며, 이산적이고 유한한 경우(finite sample place)에만 적용 가능함.  
> 대칭성 없이 확률을 1/2, 1/3처럼 나누는 것은 위험하다. 주사위처럼 대칭성과 근거가 있을 때만 균등 분포가 정당하다. 정보가 부족한 상황에서는 대칭 가정을 피하고, 무엇을 기준으로 세는지 명확히 해야 한다.

 

경우의 수(Counting)

곱의 법칙(Multiplication Rule)

\[
\text{전체 경우의 수} = n_1 \times n_2 \times \cdots \times n_r
\]

여러 개의 실험이 순차적으로 진행될 때 전체 가능한 경우의 수를 계산하는 데 사용됨

각 실험의 가능한 결과 수가 각각 \( n_1, n_2, ..., n_r \)라면 전체 경우의 수는 이들의 곱

-> 이 실험들을 combined experiments 라 하며, 이때 결과는 순서가 중요하고, 각 단계의 선택이 독립적이라는 전제가 있다.

 

이항 계수(Binomial Coefficient)

\[
\binom{n}{k} = \frac{n!}{k!(n-k)!}
\]

  • n개의 원소 중 k개를 순서 없이 선택하는 경우의 수
  • 부분집합의 개수를 의미
  • k>n인 경우에는 선택이 불가하므로, 이항 계수는 0으로 정의됨

 

Sampling

어떤 모집단(population)에서 하나의 샘플(a sample)을 추출하는 것

  순서 중요 (order matter) 순서 상관없음 (order doesn't)
복원 추출 (replace = 중복 허용)  \( n^k \) \( \binom{n + k - 1}{k} \)
비복원 추출 (don't replace = 중복 비허용) \( n(n-1)\cdots(n-k+1) \) \( \binom{n}{k} \)