본문 바로가기
반응형

뻥카와 함께하는 통계학5

뻥카와 함께하는 통계학 - 이론분포 학문은 이론을 기준으로 형성되어 있다. 이론이란게 무엇이냐. 현상을 설명하는 방법이다. 특히 과학에서의 이론은 과학에서, 이론은 1. 수학 또는 논리의 서술 2. 자연현상 모임의 방식의 증명할 수 있는 표본 3.같은 관찰이나 미래의 발생을 예측할 수 있고, 실험을 통해 테스트가 가능한 설명 이렇게 세 가지로 설명이 가능한데. 생명공학을 전공한 나로써는 가장 와닿는 설명이 3. 같은 관찰이나 미래의 발생을 예측할 수 있고, 실험을 통해 테스트가 가능한 설명 이것이다. 사실상 속마음은 통제된 환경에서 실험을 통해 결과를 낸 후, 이게 전체 자연을 설명한다. 이렇게 말하고 싶은 것이지. 과학자들 마음이 다들 똑같다. 왜냐고? 자연 전체를 실험해 볼 수는 없기 때문이다. 그래서 사람들은 실제를 본딸 이론을 만들.. 2020. 10. 31.
뻥카와 함께하는 통계학 - 모집단! 그리고 표본 저번 시간에 설명을 하던 중에 모르는 말이 많이 나왔다. 모집단이라는 말도 나왔고 표본이라는 말도 나왔다. 모집단이란게 무엇일까? 모집단(母集團) 한자로 된 말이다 맨 앞에 있것은 어미 모 글자다. 엄마가 되는 집단이라는 말이다. 모든 생물은 엄마로부터 나온다. 그러니까... 표본이 나오는 집단이 모집단인 것이다. 그러면 표본은 무엇인가? 먼저 모집단의 예부터 알아보자. 모집단이라고 하면, 정말 자연 그 자체를 말한다. 대한민국 남자의 키를 알아보자. 대한민국 남자 키의 모집단은 대한민군 남자 전체의 키다. 우리나라는 군대에 가야 하고, 군대에 가려면 신검을 받아야 하기 때문에 거의 모든 대한민국 남자는 신검을 받는다. 아마 남자 키에대한 모집단이 있는 유일한 나라가 아닐까 싶은데... 이런 독특한 이유.. 2020. 10. 23.
뻥카와 함께하는 통계학 - 분산은 왜 제곱을 쓰는가 이 전 시간데 대표값 중에서도 가장 많이 쓰이며, 유용하게 쓰이고 있는 평균값에 대해서 알아보았고, 평균값 역시 대표값중 일부이기 때문에 가질 수 밖에 없는 한계.. 즉 세줄요약처럼 요약은 되지만 자세한 사항을 잘 나타내지 못한다. 라는 한계를 어느정도 극복하기 위한 장치인 분산, 표준편차, 표준오차에 대해서도 알아보았다. 분산은 평균이 어디서부터 어디까지 퍼져있는지를 알기 위한 값이었는데, 각 값에서 평균을 뺀 값의 제곱을 한 것의 평균이었다. 그런데. 여기서 왜 꼭 제곱이어야 했을까? 다 더해서 0만 안되게 하면 되는거 아닌가. 그러면 절대값을 씌우면 되는거 아닌가? 제곱을 쓰지 않는다면, 표준 편차를 만들기 위해 다시 제곱근을 씌울 일도 없을텐데... 왜 궂이 어려운 길을 돌아가야만 한 걸까? 사실.. 2020. 10. 16.
뻥카와 함께하는 통계학 - 표준편차와 표준오차 저번 시간에는 대표값에 대해서 배웠다. 대표값은 세줄요약 같은 것으로 데이터 전체를 대략적으로 나타내주는 것이며, 항상 그 데이터를 완벽하게 나타내 주는 게 아니라는 것을 알았다. 슬램덩크를 요약하면 문제아 강백호가 농구하다가 다치는 이야기다. 이정도 요약으로는 그 안에 있는 강백호의 짝사랑, 서태웅에 대한 라이벌의식, 정대만의 농구가하고싶어요 등은 알 수가 없는 거다. 그런데 데이터가 슬램덩크라면 처음부터 끝까지 완독하고 또보고 심하면 외우기도 하겠지만. 데이터는 재미가 없다. 그러니까 사람들은 잘 나타내는 방법을 궁리하기 시작했다. 일단 대표값인 최대값 최소값 중앙값 최빈값 산술평균 기하평균 조화평균중에서 데이터를 가장 잘 나타내는 방식은 산술평균이라고 다들 생각한 것 같다. 왜?? 하필 산술평균이죠.. 2020. 10. 8.
반응형