[[seaborn]]

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
最新のリビジョン両方とも次のリビジョン
programming:python:packages:seaborn [2018/03/06] ikatakosprogramming:python:packages:graph:seaborn [2018/03/15] ikatakos
行 9: 行 9:
 seabornは、少ない設定項目で統計的にわかりやすいグラフがすぐ描ける。また、デフォルト色がパステル系でオシャレという評価が多い。 seabornは、少ない設定項目で統計的にわかりやすいグラフがすぐ描ける。また、デフォルト色がパステル系でオシャレという評価が多い。
  
-seabornも内部ではMatplotlibを使っている。ラップすることで、グラフに適した統計値を自動計算し、複数のグラフを組み合わせて表示してくれるため、(統計上この値が何を示すかの知識さえあれば)少ない設定項目でデータ概要を掴みやすくなっている。+====特徴==== 
 + 
 +seabornも内部ではMatplotlibを使っている。ラップすることで、 
 + 
 +  * グラフに適した統計値を計算 
 +  * 複数の関連するグラフを組み合わせて表示 
 + 
 +などを自動でしてくれるため、(統計上、各値が何を示すかの知識さえあれば)簡単にデータ概要を掴みやすくなっている。
 [[https://seaborn.pydata.org/examples/index.html|Example gallery]]を見れば、大体できあがるグラフの雰囲気は掴めるだろう。 [[https://seaborn.pydata.org/examples/index.html|Example gallery]]を見れば、大体できあがるグラフの雰囲気は掴めるだろう。
  
-ただ、使いやすくしたとはいえ、やはりグラフは設定項目が多い。ちょっと整形したければ、結局、matplotlibやseabornのAPIを調べなければいけない。+ただエクセルで作れるような"よくある"グラフとは一線を画すため、慣れていない人に見せるにはきちんとした説明が必要と思われる。 
 + 
 +====matplotlibの上位互換ではない==== 
 + 
 +使いやすくしたとはいえ、やはりグラフは設定項目が多い。ちょっと整形したければ、結局、matplotlibやseabornのAPIを調べなければいけない。
 最初からmatplotlibだけで書けばmatplotlibだけの知識で良いが、seabornを使うと両方について調べないといけないので、時間がかかる。その点は一長一短という所。 最初からmatplotlibだけで書けばmatplotlibだけの知識で良いが、seabornを使うと両方について調べないといけないので、時間がかかる。その点は一長一短という所。
  
行 116: 行 127:
 [[https://seaborn.pydata.org/generated/seaborn.pointplot.html|seaborn.pointplot — seaborn 0.8.1 documentation]] [[https://seaborn.pydata.org/generated/seaborn.pointplot.html|seaborn.pointplot — seaborn 0.8.1 documentation]]
  
-折れ線グラフは、pointplot +折れ線グラフは、seabornではなくmatplotlib純正のplot()使った方がよい。というかseabornには存在しない。
-といいつつ、seabornには純粋に折れ線グラフを描く機能のみの関数は存在しない。折れ線は設定が単純なので、matplotlibをそのまま使えばよい。+
  
-pointplotが"一工夫"してれるは、集計値と信頼区間の折れ線を描ける点。+一応、pointplot()それっぽいが、横軸が数値データでなくカテゴリデータとして扱われる。つまり、(x,y)=(1,1)(2,2)(3,3)(5,5)とデータがあった場合、折れ線グラフであれば3と5の間に1つ分のスペースを空けるのが妥当だがseabornでは等間隔で描かれる。ので、やはり素直にmatplotlibを使いましょう。 
 + 
 +x軸が等間隔であることが保証されていたり、カテゴリデータであるなら、pointplot()は使える。特に、任意の集計値とその信頼区間を描ける点はmatplotlibには無い利点である
  
 通常、折れ線グラフに与えるデータは1次元(x軸の項目に対応するy軸の値が1対1対応で存在している)。 通常、折れ線グラフに与えるデータは1次元(x軸の項目に対応するy軸の値が1対1対応で存在している)。
  
 pointplotでは、1つのx軸の項目に対応する値が複数個あるようなデータを渡すと、任意の集計値(初期設定は平均値)とその信頼区間を描いてくれるので、データの概要を掴みやすい。 pointplotでは、1つのx軸の項目に対応する値が複数個あるようなデータを渡すと、任意の集計値(初期設定は平均値)とその信頼区間を描いてくれるので、データの概要を掴みやすい。
 +
 +  x                ↑       |
 +  A  [ 5, 10, 15]    |    |/|
 +  B  [10, 20, 30] -> | |/|
 +  C  [40, 30, 20]    | |
 +                     ┼────→
 +                        A  B  C
  
 ^ 引数                                                                                                       ^ 型                    ^ 初期値    ^ 説明                                                                                     ^ ^ 引数                                                                                                       ^ 型                    ^ 初期値    ^ 説明                                                                                     ^
programming/python/packages/graph/seaborn.txt · 最終更新: 2018/03/15 by ikatakos
CC Attribution 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0