베이지안과 프리퀀이스트 Bayesian and Frequentist:
우리는 살면서 어떤 사건이나 현상 그리고 선택에 대해서 결정을 내릴때 가끔 이런 말을 듣는다. “내 경험에 의하면 무엇 무엇은 이렇 이렇고, 무엇 무엇은 저렇 저렇다. 그래서 결론은 어떻 어떻다.” 좀 더 쉽게 요즘 말로 하자면 “라떼는 말이야…” 라고 생각해도 된다. 우리는 이런 경우의 생각을 가진 사람을 경험주의자라고 부른다. 수학/통계학에서는 이런 분들을 프리퀀이스트 Frequentist 라고 부르기도 한다.

이미지 출처: https://m.blog.naver.com/vipgarden/221750767002
프리퀀이스트는 한 현상에 대해 추측하거나 결정을 내릴때 지정한 데이터와 시간을 관찰한다. 그리고 그 관찰한 경험으로 결론을 내린다. 주식으로 례를 들어 보면 더 쉽게 알아 볼것 같다. 주식가격을 오른다, 내린다 두가지 결과가 나온다고 가정하자. 그리고 총 5일의 주식 가격을 관찰 했다고 가정한다.
| 날자 | 주식 가격 결과 |
| 첫째 날 | 오른다 |
| 두번째 날 | 오른다 |
| 세번째 날 | 내린다 |
| 네번째 날 | 내린다 |
| 다섯번째 날 | 내린다 |
프리퀀이스트의 방법으로 주식 가격을 계산하면
주식 가격이 오르는 확률은 2 / 5 * 100% = 40%
주식 가격이 내리는 확률은 3 / 5 * 100% = 60%
(우리가 주식 가격을 1000일 이상으로 관찰하면 가격이 오른다/내린다가 나오는 확률은 또 다르게 나올 것이다.)
베이지안의 방법은 많이 다르다. 베이지안은 결과에 대한 결론을 미리 가정한다. 그리고 새로운 사실과 조건에 의해서 그 결론이 변한다. 수학공식으로 표현하자면 아래와 같다.

이미지 출처: https://en.wikipedia.org/wiki/Bayes%27_theorem (프롤로그에서 얘기하다 싶이 이번 시리즈에서 수학 해석을 안 한다. 해석하기에는 너무 글이 길어 지고 읽는 분도 지칠것 같다.)
한 마디로 베이즈 리론을 요약 하자면 “한 현상의 결론에 대한 추측은 사실이 변하는데 의해서 변한다”. 더 쉽게 말하자면 “사실이 변하면 추측을 바꿔야 한다”. 주식 가격 례를 또 들어 보겠다. 다시 말하지만 베이지안은 결론을 미리 가정 한다. 그래서 오른다/내린다 나오는 활률을 각각 50% 라고 가정 한다.
(베이지안 풀이과정 생략.)
| 첫째 날 주식 가격 가정 확률 | 오른다 50%, 내린다 50% |
| 첫째 날 주식 가격 결과 | 오른다 |
| 두번째 날 주식 가격 추측 확률 | 오른다 66%, 내린다 33% |
| 두번째 날 주식 가격 결과 | 오른다 |
| 세번째 날 주식 가격 추측 확률 | 오른다 75%, 내린다 25% |
| 세번째 날 주식 가격 결과 | 내린다 |
| 네번째 날 주식 가격 추측 확률 | 오른다 60%, 내린다 40% |
| 네번째 날 주식 가격 결과 | 내린다 |
| 다섯번째 날 주식 가격 추측 확률 | 오른다 50%, 내린다 50% |
| 다섯번째 날 주식 가격 결과 | 내린다 |
보시다 싶이 새로운 결과가 나올때 마다 베이지안은 다음날 주식 가격에 대한 확률을 매번 바꾼다. 프리퀀이스트가 관찰에 의해서 결론을 내린다면 베이지안은 새로운 사실을 근거로 새로운 결론을 내린다. 그렇다고 프리퀀이스트가 틀리다고 말할수는 없다. “라떼는 말이야..” 라는 사람을 꼰대 라고 부르지만 꼰대의 말도 맞을 때가 있듯이 경험주의가 무조건 틀린것은 아니다. 사물과 사건에 대해 보는 방식과 해결 방식이 다를 뿐이다.
데이터 Data:
어떤 학자들은 사람이 결정을 내릴때 자기 이익에 맞는 이성적인 판단을 한다고 생각 했다. Dior가방을 산다고 가정하자. 우리는 아마 마음에 드는 가방을 보면 후기를 읽어 보고, 시즌을 체크 하고, 가격을 따지고 그 가방을 살지 안 살지에 대해서 결정을 내린다. 물론 이 과정을 모두 스킵하고 비 이성적인 선택을 많이 할때도 있다. 하지만 중요한 선택을 할때 사람들은 정보를 더 찾아 보고 그 정보에 의해서 판단을 내린다. 그 정보는 즉 인퍼메이션이라고 부르기도 하고 수많은 인퍼메이션이 모이면 데이터가 된다. 사람은 즉 데이터로 이성적인 결정과 판단을 내릴수 있다.

이미지 출처: https://www.springboard.com/blog/data-science/lp-machine-learning-unsupervised-learning-supervised-learning/
모든 인퍼메이션은 캐릭터로 표기되고 데이터로 기록된다. 경제학자들은 데이터로 경제성장을 추측하고 , 생물학자들은 데이터로 병리를 분석 하고, 환경학자들은 데이터로 기후변화를 연구한다. 우리가 보는 영상, 듣는 음악, 지금 쓰고 있는 글, 모두가 데이터로 저장된다. 앞에서 말하다 싶이 베이지안은 새로운 사실이 발생 할때마다 추측을 바꾼다고 했다. 그 “사실”을 데이터로 만들고 베이지안의 방법을 컴퓨터에 주입하면 그 컴퓨터는 사람처럼 한 현상에 관한 추측을 하거나 결론을 내릴때 이성적인 선택과 결정을 할수가 있다.
머신러닝 Machine Learning:

인공지능은 사람처럼 데이터로 공부를 하고 그 지식을 이용해서 “생각”을 한다. 새로운 데이터가 주입되면 새로운 지식을 얻게 되고 새로운 판단과 결정을 내릴수 있다. 컴퓨터가 그 배우는 과정을 머신러닝 이라고 한다. 사람이 지식을 배울때 선생님이 가르치는 것을 주입하고 응용하는 방법이 있다. 그리고 관찰을 통해서 스스로 배우는 방법도 있다. 더 나아가서 공부 할때 선생님한테서 칭찬을 받으면 공부를 더 잘하기도 하고 비평을 받으면 실수를 멈추기도 한다. 인공지능도 마찬 가지다.
인공지능에서는 선생님이 가르치는 공부를 슈퍼바이즈드 러닝(Supervised Learning) 이라고 부른다. 관찰을 통해서 스스로 배우는 방법을 언슈퍼바이즈드 러닝(Unsupervised Learning) 이라고 부르고, 선생님한테서 공부를 잘하면 칭찬을 받고 실수를 하면 비평 받는것을 리인포스먼트 러닝(Reinforcement Learning) 이라고 한다.
례를 들면 어린 아기한테 강아지가 무엇이고 고양이가 무엇이고 어떻게 생겼는 지에 대해서 가르친다고 하자. 우리는 강아지 사진들과 고양이 사진들을 아기한테 보여주면서 이렇게 생기면 고양이고, 저렇게 생기면 강아지라고 가르친다. 그리고 강아지 사진을 들고 아기한테 물어 보면 아기는 “강아지”라고 대답한다. 인공지능도 똑 같이 가르칠수 있다. 고양이 이미지 데이터와 강아지 데이터를 분류해서 머신러닝 알고리즘으로 컴퓨터에게 지식을 가르친다. 그리고 새로운 고양이 사진을 인공지능한테 물어 보면 그 인공지능은 고양이라고 대답을 한다. 이 과정을 슈퍼바이즈드 러닝 이라고 부른다.

이미지 출처: https://www.springboard.com/blog/data-science/lp-machine-learning-unsupervised-learning-supervised-learning/
다른 시나리오를 생각 해보자. 선생님이 아기한테 엄청 많은 강아지 사진을 보여준다. 그리고 수많은 고양이 사진을 보여 준다. 그 다음 새로운 강아지 사진을 들고 아기한테 물어 본다. “이 사진은 어느 동물에 가까울까?” 하면 아기는 강아지 쪽으로 분류를 할 가능성이 크다. 인공지능도 비슷한 방식으로 이런 결론을 내릴수 있다. 우리가 강아지가 무엇인가 고양이가 무엇이다라고 가르치지 안는 대신 강아지와 고양이 사진을 엄청 많이 보여준다. 그리고 새로운 고양이 사진을 보여 주면서 인공지능한테 “이것은 무엇일까?”라고 물어보면 고양이라고 분류한다. 이 과정을 언슈퍼바이즈드 러닝 이라고 한다.
마지막으로 흔한 시나리오를 생각해 보자. 수학 선생님이 한 학생한테 수학 문제를 풀게 한다. 문제를 잘 풀면 추가 점수를 주고 실수를 하면 점수를 깍는다. 끊임 없는 문제 풀이를 통해서 그 학생은 여러가지 문제 풀이 방식을 습득 할수가 있다. 마찬가지로 인공지능한테 실수를 하면 점수를 깍고 문제를 잘 풀면 점수를 더해 주면서 공부를 시키면 점점 더 낳은 판단과 결정을 내리게 할수 있다. 이렇게 배우는 과정을 리인포스먼트 러닝이라고 한다. 그 유명한 알파고 (AlphaGo) 가 바로 이런 방식으로 바둑을 배웠다.
결말:
세가지 방법외에 인공지능은 더 파워풀한 방법으로 지식을 배우고 또 사람만 할수 있었던 능력을 습득한다. 인공지능은 그 방법으로 음악도 만들고, 차도 몰고, 그림도 그린다. 다음편에 인공지능은 어떻게 딥러닝Deep Learning을 통해서 “보는” 능력을 습득 했는지 소개 하겠다.
참고자료:
- Yagcioglu, S. (2022, February 25). Classical Examples of Supervised vs. Unsupervised Learning in Machine Learning. Springboard Blog. https://www.springboard.com/blog/data-science/lp-machine-learning-unsupervised-learning-supervised-learning/
- Wikipedia contributors. (2022b, April 20). Bayes’ theorem. Wikipedia. https://en.wikipedia.org/wiki/Bayes%27_theorem
- Wikipedia contributors. (2022c, April 23). Frequentist inference. Wikipedia. https://en.wikipedia.org/wiki/Frequentist_inference
- Pascual, C. (2018, July 18). Basic Statistics in Python: Probability – PyBloggers. Pybloggers. http://www.pybloggers.com/2018/07/basic-statistics-in-python-probability/
- I. (n.d.). Machine Learning Robot afbeeldingen, beelden en stockfoto’s – iStock. istockphoto. https://www.istockphoto.com/photos/machine-learning-robot

베이지안 정리를 이렇게 쉽게 설명하다니요. 기계가 아닌 인간을 슈퍼바이즈하는 재주도 탁월할 것 같습니다.
감사합니다. 베이시언이 아니고 베이지안이라고 쓰는걸 이제 알게 됐습니다. 글 오류 수정 했습니다.
와, 참고자료도 따로 정리해주는 센스까지. 조리정연한 글 잘 읽었습니다. 청소년이 읽어도 알아볼 수 있을 정도로 어려운 개념을 이해하기 쉽게 풀었네요👍
항상 읽어 주고 피드백 주셔서 고마워! 😊
오오 정말 쉽게 잘 풀어주셨군요, 문돌이 끄덕끄덕
읽어 주셔서 감사합니다.
안녕하세요. 작가님의 [인공지능 패러다임]에 관한 글들이 우리나무의 “시리즈”로 선정되었습니다. 상세정보는 메뉴에 있는 “시리즈”를 클릭하고 확인하길 바랍니다. 계속하여 좋은 글 부탁드립니다.
제 주식은 내리기만 하는군요. 프리퀀이스트로도 해석이 불가한… 좋은 글 잘 읽고 많은 걸 얻어갑니다.
감사합니다. 제가 산 주식도 내려 가기만 합데다. 존버 할수 밖에 없습데다 ㅎㅎㅎㅎ.