적률의 배경
적률추정법은 통계학의 근본이 되는 수리통계학에서 나오는 개념이다. 적률추정법을 이해하는데 있어 난관은 적률의 의미이다. 적률(moment)을 한마디로 나타내면 확률변수
모멘트는 한 마디로 질량이 분포된 모양에 따라 그 효과가 달라지는 현상을 말한다. 예를 들어 몸무게 같은 두 명의 사람이 시소를 탄다고 하자. 이 때 두 사람이 모두 양 끝에 탔을 때랑, 한 사람은 끝에 한 사람은 한 칸 앞에 탔을 때 작용하는 모멘트가 달라지는 것과 같다. 즉 두 사람의 질량은 같아도 질량이 분포된 모양(거리)에 따라 효과가 달라지는 것이다.
다시 돌아와 앞전의 어떤 물리량이란 것은 질량, 힘, 길이 등이 될 수 있고 쉽게 (질량 x 거리), (힘 x 거리), (길이 x 거리)로 표현하는 것을 모멘트(=적률)이라고 한다. 참고로 모멘트와 모멘텀(Momentum)이 비슷해 혼동되기도 하는데 이 둘은 다른 개념이다. 모멘텀은 운동량을 의미하는 것으로 모멘텀(운동량) = 질량(Mass) * 속도(Velocity)이다. 예를 들어 거대한 선박이 있다면 질량이 크고 속도는 작은 운동량을 가질 것이고, 어떤 총알이 날아간다면 질량은 작고 속도는 큰 운동량을 가진다.
통계학에서의 적률의 의미와 정의
그렇다면 이 적률(모멘트)은 왜 통계에서 사용할까? 그 이유는 위 언급한 "분포"와 관련있기 때문이다. 물리학에서 모멘트는 앞서 시소 예제와 같이 질량과 거리에 따라 달라졌다. 통계학에서의 적률은 확률과 확률변수에 따라 적률이 달라진다. 질량이 확률로, 거리가 확률변수로 바뀐 것이다. 그렇다면 이제 통계에서의 적률의 의미를 살펴보자. 적률은 초반부에 설명했듯 한 마디로 확률변수

즉 확률분포의 특징을 나타내는 척도(Measure)는 4가지로 평균, 분산, 왜도, 첨도가 있고 이는 적률의 확률분포 X의 n제곱의 기대값을 통해 나타낼 수 있다. 평균은 원점에 대한 1차 모멘트로
원점에 대한
이 때
적률생성함수의 필요성과 정의
적률의 수식 정의에 따라 연속확률변수에서 적률을 구하기 위해 적분을 해야하지만 적분 계산이 어렵거나 불가능한 경우도 있기 때문에 이러한 상황을 해결하고자 적률생성함수(Moment Generating Function, MGF)를 만들어 사용한다. 적률생성함수는 적률과 마찬가지로 이산확률변수와 연속확률변수로 나뉘어 다음과 같이 정의된다.
이 적률생성함수에서 n차 적률을 구하기 위해서는 적률생성함수를
이를 적률생성함수의 기대값 속의
다음으로
이를 원래 적률생성함수에 대입하게 되면 다음과 같아진다.
위의 기대값 내부에 있는 항을 분리해서 표현하면 다음과 같아진다.
기대값과 무관한 항을 앞으로 빼주면 다음과 같다.
따라서 적률생성함수는 다음과 같다.
여기서 구한 적률생성함수는 미분을 통해 사용한다. 만약 1번 미분한다면 다음과 같다.
또 만약 2번 미분한다면 다음과 같다.
또
마지막으로 n번 미분한다면 다음과 같은 n차 적률을 구할 수 있게 되는 것이다.
즉 요약하면 적률생성함수란 확률변수
적률추정법
적률의 배경과 의미와 정의부터 적률생성함수를 만들어 미분해서
돌아와 적률추정법은
이러한 적률추정법은 점추정량을 구하는 가장 오래된 방법으로 최대가능도보다 자주 사용되진 않으나 손쉽게 계산 가능하다는 장점이 있다. 반면 비현실적인 추정량을 제시하는 경우가 있다는 단점이 존재한다. 이를 보완하기 위해 최대우도법(MLE), 베이즈 추정법 등을 사용한다.
덧붙여, 이 적률은 딥러닝에서 Adam Optimizer에 활용된다.
Reference
[1] 모멘트 & 모멘텀
[2] 모멘트( moment ) (lifeisforu)
[4] 적률법 (위키백과)
[6] Option Skew — Part 6: The Skewness and Kurtosis for a Lognormal (Roi Polanitzer)
[7] [확률과 통계] 45. 적률과 적률생성함수, Moment & Moment-Generating Function (mykepzzang)
[8] [통계 적률의 이해] 7. 적률생성함수 수학 거의 없이 이해하기 (통계의 본질)
[9] [통계학] 17. 추정법과 점추정량 - 적률법, 최대가능도추정법, 일치성, 비편향성, 효율성 (AI 꿈나무)
[10] [적률의 이해] 6. 적률생성함수란? (통계의 본질)
[11] Method of Estimation 추정법 (정보통신기술용어해설)
'Artificial Intelligence > 확률-통계학' 카테고리의 다른 글
[확률/통계] 회귀분석과 상관분석이란? (Regression Analysis and Correlation Analysis) (0) | 2022.10.24 |
---|---|
[확률/통계] 모수적 방법과 비모수적 방법 (parametric and non parametric) (0) | 2022.10.23 |
[확률/통계] 가설 검정 이해하기 (귀무가설, 대립가설) (0) | 2022.10.21 |
[확률/통계] 베이즈 정리 이해하기 (Bayesian Theorem) (0) | 2022.10.11 |
[확률/통계] 누적분포함수 (CDF, Cumulative Distribution Function) (0) | 2022.10.10 |