박스 플롯 예제

avatar
| Uncategorized

상자 플롯(상자 및 수염 플롯이라고도 함)은 데이터의 중간 값과 사분위수 또는 데이터의 25% 분할을 사용하여 데이터를 표시합니다. 그림 6. 개별 점수와 수단을 보여주는 상자 플롯입니다. 첫 번째 사분위수는 2이고 중앙값은 7이고 세 번째 사분위수는 9입니다. 가장 작은 값은 1이고 가장 큰 값은 11.5입니다. 다음 이미지는 구성된 상자 플롯을 보여 주며, 이 그림은 다음과 같은 것입니다. 데이터 과학은 결과를 전달하는 것에 관한 것이므로 항상 약간의 작업 (코드 여기)으로 boxplots를 조금 더 예쁘게 만들 수 있습니다. 표 2. 상자는 여성의 시대에 대한 용어와 값을 플롯.

파이썬을 통해 박스 플롯을 그래프로 그리는 몇 가지 방법이 있습니다. 바닷가, 팬더 또는 바닷가를 통해 박스플롯을 그래프로 만들 수 있습니다. “꿀벌 떼” 플롯은 이 데이터 집합에 10과 15 에 가까운 데이터가 많지만 그 사이에는 상대적으로 적은 데이터가 있음을 보여줍니다. 상자 플롯이 이것에 대한 증거를 제공하지 않는지 확인하십시오. 통계 분석 프로그램은 상자 플롯을 작성하는 방법에 대한 옵션을 제공할 수 있습니다. 예를 들어 그림 6의 상자 플롯은 데이터에서 생성되지만 여러 가지 방법으로 이전 상자 플롯과 다릅니다. 우리는 이미 데이터를 시각적으로 표현하는 기술에 대해 논의했습니다 (히스토그램 및 주파수 다각형 참조). 이 섹션에서는 상자 플롯이라는 또 다른 중요한 그래프를 제시합니다. 상자 플롯은 이상값을 식별하고 분포를 비교하는 데 유용합니다. 우리는 동급 생 실험에서 데이터의 도움으로 상자 플롯을 설명합니다. “스트롭 간섭 사례 연구”의 일환으로 입문 통계의 학생들은 30 개의 컬러 사각형이 들어있는 페이지를 제시했습니다.

그들의 임무는 가능한 한 빨리 색상의 이름을 지정하는 것이었습니다. 그들의 시간 (초)이 기록되었습니다. 실험에 참여한 16명의 남성과 31명의 여성의 점수를 성별별로 별도의 상자 플롯을 만들어 비교합니다. 이러한 디스플레이는 병렬 상자 플롯을 포함한다고합니다. 위의 이미지는 거의 정규 분포의 박스플롯과 정규 분포에 대한 확률 밀도 함수(pdf)를 비교한 것입니다. 이 이미지를 보여주는 이유는 통계 분포를 보는 것이 상자 플롯을 보는 것보다 더 일반적이기 때문입니다. 즉, 박스플롯을 이해하는 데 도움이 될 수 있습니다. 다음 그래프는 상자 및 수염 플롯을 보여 줍니다. 상자 플롯(상자 및 수염 플롯 또는 상자 수염 플롯이라고도 함)은 데이터 농도에 대한 좋은 그래픽 이미지를 제공합니다. 또한 대부분의 데이터에서 극단적인 값이 얼마나 멀리 떨어져 있는지도 보여 준다.

상자 플롯은 최소값, 첫 번째 사분위수, 중앙값, 세 번째 사분위수 및 최대값의 다섯 가지 값으로 생성됩니다. 이러한 값을 사용하여 다른 데이터 값이 해당 값에 얼마나 가까운지 비교합니다. 일반적으로 분산된 대규모 데이터 집합에서 이상값으로 의심되는 경우는 드물지 않습니다(예: 100개 이상의 데이터 포인트). 이상값은 약 10,000개 이상의 데이터 요소가 있는 일반적으로 분산된 데이터 집합에서 예상됩니다.