일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 입문
- 조건문
- mysql
- 텍스트
- 마이닝
- Beautifulsoup
- 파이썬3.5
- 데이터사이언티스트
- 크롤링
- 함수
- 매개변수
- Loop
- 코딩교육
- Def
- 데이터
- for
- 인수
- 기초
- 반복문
- if
- 텍스트마이닝
- 클린코드
- Request
- Pycharm
- CRAWL
- Python
- 프로그래밍
- urllib
- 시각화
- 파이썬
- Today
- Total
IT is Smart
나이팅게일은 데이터사이언티스트 (3/3) 본문
뭐시 중헌디
위의 이야기에서 핵심이 되는 내용을 몇가지 뽑아보자.
1) 의료기록을 표준화했다.
2) 모든 의료상황을 빠짐없이 기록했다.
3) 기록을 통계로 정리했다.
4) 데이터를 이해하기 쉽게 도식화했다.
5) 사람들에게 널리 알렸다.
나이팅게일의 위대함을 이 5가지 때문이라고 설명할 수는 없지만,
나이팅게일의 성공에 이 5가지 중 어느 1가지도 뺄 수 없다.
1, 2, 3번을 묶어서 데이터 분석라고 할 수 있고, 4, 5번이 데이터 시각화이다.
결국 나이팅게일의 성공 키워드를 뽑자면 데이터 분석과 데이터 시각화가 바로 그것이다. 160년 전의 일이다.
안타깝게도 나이팅게일 이후 100년이 넘도록 이 강력한 힘들은 제대로 빛을 보지 못했다.
그 이유는 이 두 힘 모두 많은 시간과 돈이 필요했기 때문이다.
먼저 데이터를 분석하기 위해서는 데이터를 모으는 일부터 해야 한다.
사람이 직접 하든 기계를 이용하든 많은 비용을 들여 데이터를 모으더라도 그것을 다시 정리하기 위해서 또 비용이 소모된다.
그렇게 정리하고 나면 다시 통계적으로 분석을 해야 하는데 경우에 따라 정도의 차이는 있지만 상당한 수준의 수학능력이 필요하다.
직접 수학자가 되거나 전문가를 고용하는 것 모두 돈과 시간을 필요로 한다.
결국 데이터를 모으고 통계로 분석하는 일은 그 결과가 수익으로 바로 연결될 수 있는 산업분야 또는 정부의 조세수입과 관련된 분야에 제한적으로 활용되어 온 것이다.
또 데이터 시각화를 구현하는 것은 데이터가 의미하는 것을 이해하는 능력뿐만 아니라 예술적 능력까지 필요로 한다.
통계와 시각화의 힘은 지금도 여전히 유효하다.
나이팅게일의 도표는 영국의 영국 통계학자 윌리엄 파르의 도표를 개선한 것이다.
파르는 나이팅게일과 비숫한 자료를 갖고 월별 사망원인을 분석한 도표를 그렸는데, 월별 사망자 수를 넓이가 아닌 원의 반지름 위에 길이로 나타내고 그 점을 연결했다.
이 도표를 보는 사람들은 선의 길이가 아닌 면적이 사망자 수를 뜻한다고 착각한다.
결과적으로 월별 사망자 수의 차이를 과장하게 된다.
나이팅게일은 파르의 도표가 갖는 문제점을 간파해 선의 길이가 아닌 쐐기의 면적으로 사망자 수를 나타낸 새로운 그림을 그린 것이다.
'Case Study > Usecases' 카테고리의 다른 글
나이팅게일은 데이터사이언티스트 (2/3) (0) | 2017.11.11 |
---|---|
나이팅게일은 데이터사이언티스트 (1/3) (0) | 2017.11.11 |
한스 로슬링 Hans Rosling (0) | 2016.08.27 |