前回までの記事でヒルクライムに参考になるデータとして、坂の平均勾配や勾配のばらつきを示す標準偏差の算出、斜度ごとのグラフ化を紹介してきました。今回は坂の勾配の分布の様子の図示化について紹介したいと思います。
まずひとつ目は箱ひげ図になります。箱ひげ図はデータ分布の把握に使われる図表のひとつです。箱部分でデータの真ん中の50%部分の分布を示し、直線の部分で最大値、最小値までの両端の25%の分布を示しています。真ん中の赤い線は中央値を示しています。
一つの図表で全体数値の分布がわかるので、統計データの表示にはよく利用される図表になります。
箱ひげ図の作成はmatplotlib ライブラリーを使って簡単に行えます。以下はそのコードですが、プロットの命令のところをplt.boxplot(変数) とするだけで作成できます(このコードで作成した図が上の説明図になります。但し、説明用のコメント(最大値、中央値・・・・など)は表示されません)
坂の勾配のメインが3%〜9%程度ですが、最大17%ぐらいのところがあるということが視覚的に感じ取れるのではないでしょうか。ヒルクライムデータで箱ひげ図が使われているのはあまり見たことはありませんが、視覚的に見やすい図表として活用してみるのもいいかもしれません。
次回はもうひとつの別の図表の作成について紹介したいと思います。