差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
次のリビジョン両方とも次のリビジョン
programming:python:packages:pandas:format_output [2019/11/19] – [カラム毎に小数点以下を揃える] ikatakosprogramming:python:packages:pandas:format_output [2020/03/19] – [NaNを含むintカラム] ikatakos
行 43: 行 43:
 df['col'] = df['col'].fillna(-1).astype(int) df['col'] = df['col'].fillna(-1).astype(int)
 </sxh> </sxh>
 +
 +=== pandas.Int64Dtype型を使う ===
 +
 +未検証、pandas ver.0.24から導入された新しめの手法。
 +
 +numpyはnanを扱えないので、pandasのレイヤーでnanを扱えるint型を独自定義した感じ。
 +
 +ただ、floatからのキャストでエラーが出て、イマイチよく使い方がわかっていない。
 +
 +  * [[https://qiita.com/hkzm/items/52195729e9b00ae88789|pandas 1.0.0 (rc0) での pd.NA の特徴 - Qiita]]
 +
  
 =====カラムの選択・並べ替え===== =====カラムの選択・並べ替え=====
行 147: 行 158:
  
   * (*) 検証方法   * (*) 検証方法
-  * $a=0.0~1.9,b=0.0~1.9$ の $a,b$ の組400通りにつき、小数点1桁目を丸めての $a'-b'$ と、元の $a-b$ との誤差は、+  * $0.0~1.9$ の0.1刻みの $(a,b)$ の組400通りにつき、小数点1桁目を丸めての $a'-b'$ と、元の $a-b$ との誤差は、
     * 偶数丸めで処理した結果: MAE=0.335, RMSE=0.4123     * 偶数丸めで処理した結果: MAE=0.335, RMSE=0.4123
     * 四捨五入で処理した結果: MAE=0.33, RMSE=0.4062     * 四捨五入で処理した結果: MAE=0.33, RMSE=0.4062
programming/python/packages/pandas/format_output.txt · 最終更新: 2021/12/09 by ikatakos
CC Attribution 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0