그래프 알아보기-막대그래프

반응형

막대그래프 뭔지 아시죠? 그 막대기들 여러개 서있어서 음 여기는 이렇고 저기는 저렇군 하는 그래프 있잖아요. 그 막대기들에 따라 배리에이션이 좀 있긴 한데 아무튼.

 

이 시리즈에서는 이 그래프가 어떤 상황에 써야 하는지, 쓰면 안 되는 상황이 있는지를 알아보자. 직접 그림을 올려주면 좋은데 맥북은 옛저녁에 반납했고 윈도에는 Plotly가 안 깔려있음... (애초에 윈도우에서는 JS를 주로 해서...)


막대그래프는 언제 쓰나요?

거 애플 이번에 경영진 터너스로 바꾼다면서요? 그럼 이제 아이튠즈 안되면 쿡이 말고 터너스 부르면 될듯… 아무튼. 내가 애플 직원인데 이번달에 어떤 기기들이 어떻게 팔렸나 보고싶어요. 아이폰이면 걍 아이폰 있고 프로라인도 있잖아요? 그리고 맥북도 걍맥북 네오 에어 프로(개비쌈) 있을거고 아이패드도 에어 프로 있고 프로도 11 12.9 있고. 그러면 얘네들의 판매량을 어떻게 비교하지?

 

이럴때 막대그래프를 쓴다. 아이폰끼리 볼거면 아이폰 15 16 17 해놓고 막대그래프 그려서 이렇게 나왔습니다, 할 수도 있고 세분류 들어가서 어 이거 프로맥스가 잘팔렸는뎁쇼? 할 수도 있다. 그거는 뭐 그리는 사람+데이터 보고 싶은 사람 마음이긴 한데 막대그래프는 일단 범주별로 값을 비교할 때 쓴다. 전에 clinVar EDA 한 것들 중에 그거 있었죠? 염색체별로 변이가 많은 유전자. 그것도 막대그래프인데 이제 내림차순으로 정렬한거다.

 

그리고 도수분포 볼 때도 쓴다. 씨본 불러오셨으면 histplot 쓰셔도 되고... 히스토그램도 막대그래프잖음.

 

배리에이션

1. 막대그래프: 그냥 막대그래프(막대가 서있음)

2. 수평 막대그래프: 막대그래프인데 막대가 드러누워서 아빠 안잔다를 시전한다. 이게 가끔은 수직보다 수평이 더 잘 보일 때가 있습니다.

3. 쌓여있는 막대그래프: 막대그래프인데 같은 범주에 속하는 막대가 층층이 쌓여있다. 아이폰이면 아이폰 15, 16, 17을 한 축 위에 쌓아놓는 구조.

4. 분할 막대그래프: 쌓여있는거랑 비슷한데 전체 막대 길이가 같고 같은 범주 내에서 '비율로' 나눠져있는 그래프다. 아이폰을 100%로 잡고 15, 16, 17 비율을 안에서 나누고 아이패드 100%로 잡고 프로 에어 비율 나누고 이런 식.

5. 그룹 막대그래프: 그냥 묶은거다. 예를 들어서 연령대별 성비를 본다 그러면 20대 안에 남자 여자 작대기 하나씩 있는거.

 

써도 되는 상황

얘는 사실 쓰면 안 될 때 빼고 다 된다고 보시면 된다. 진짜 많이 씀.

 

쓰면 안되는 상황

시계열이라고 아십니까? 일정한 시간의 간격으로 관측한 데이터인데, 우리 주변에서 쉽게 볼 수 있는건 수면 시간(매일 얼마나 퍼잤나+잘잤나), 걸음 수와 이동 거리(몇 걸음 걸었고 몇km 이동했나), 주식(…)정도이다. 이거 꺾은선그래프 얘기할 때 다시 얘기해드림.

 

우리팀은 아닌데, 부트캠프 팀플할때 미드프로젝트에서 시계열 데이터를 막대그래프로 그렸다고 혼난(?) 팀이 있었다. 왜냐고? 시계열은 시간의 흐름에 따른 데이터니까 보통 꺾은선으로 그리거든요. 주식도 그 작대기 오르내리는거 아니면 꺾은선으로 그리잖아요? 근데 또 아이폰 건강앱에서 걸음수는 막대그래프로 나오지 않냐 하실 수도 있는데(안드로이드는 내가 안 써서 모름), 그건 시간의 흐름에 따라 보여주는 게 아니라 어제보다 오늘 더 걸었다 혹은 덜 걸었다를 보여주는 용도다. 그 건강앱에서도 하루 24시간동안 걸은 걸음 수나 거리는 꺾은선그래프로 나온다.

 

그리고 전체에서 어떤 비율을 나타내고 싶을 때는 파이차트를 그립니다. 도넛차트 그리는 사람도 있다고요? 거 파이차트에 구녕뚫으면 그게 도넛이여. 보통 어떤 '비율'을 나타낼때는 도나쓰나 파이차트를 쓰지 막대그래프를 쓰진 않는다. 아니면 전체를 100%로 잡고 나눠서 그리는 방법도 있는데, 항목이 많으면 막대그래프를 쓰는 게 나을 수도 있지만 항목이 하나면 파이나 도나쓰가 좋다. 막대그래프는 왜 하나일때 안 쓰냐고? 막대가 너무 넙대대하면 안이뻐요...

반응형