ちぇりーごー

ただのギャンブラー

pandas.to_csvでUnnamedカラムを追加したくない場合


pandas.to_csvでインデックスを指定せずに出力すると、Unnmaed:0というカラムが追加されて出力されることに気づいた。
格別理由がなければあとから消すなりすればいいが、最初から追加せずに済む方法を調べたのでメモする。


to_csv引数のinplaceをTrueにすればUnnmaedカラムが追加されずに済む。

pd.to_csv('output.csv',inplace=True)


または、

index_col=0

でもOK.

XGBoostがpip installでコケる

mac環境でpip install xgboostがコケた。
エラーログ最下部には以下のメッセージが出力されていたので、そのままググる

Command "python setup.py egg_info" failed with error code 1 in ~/

setuptoolsをアップグレードすれば直る場合もあるようだが、今回は動かず。
cherries5557.hatenablog.com


エラーログを読み込んでみると、XGBoostLibraryNotFoundとあり、どうやらgccが原因のようだ。

brew install gcc5

これで動いた。

Jupyterのカラースキームを変更する

自分用。
中身がないので、せめで外見だけでも(汗)

Jupyter Themesがカンタン。

ダークな黒背景でクールにデータ解析!Jupyter Notebook Themes & Emacs KeyBinding | Futurismo

GitHub - nsonnad/base16-ipython-notebook: Themes for your IPython Notebook

Jupyter Notebookを自分仕様に:背景,アイコンの変更 - Qiita

Jupyter のテーマを変える - Qiita

ipythonのqtconsoleの色やフォントを設定する | mwSoft

Prophetで金融データの予測

ProphetとはFacebookが開発した時系列の予測ツールです。

github.com
pip環境であれば、pip installでインストールできます。
※インストールに少し時間がかかります。

データはなんでもいいのですが、
今回は、FREDより以下のデータを拝借しました。
10-Year Treasury Constant Maturity Rate | FRED | St. Louis Fed


データさえ用意できれば、あとはほとんどチュートリアルに従えば予測が出せます。
注意点は、データフレームのカラム名が指定されているので変更が必要なことくらい。

今回は、(200*5)年分の予測を出してみたいと思います。
結果が以下。

f:id:Cherries5557:20170824194049p:plain


この結果ではweekly_seasonalityをTrueにしているだけですが、
FRB政策金利アナウンス日などのイベントデータを取り込むなど
精度向上の余地はまだまだありそうですね。

時系列データの日付をインデックスとして扱いたくない場合

なぜかいつも忘れるのでメモ
.reset_idnexで日付をカラムにできる。
文字列ではなくて、Timestampになっているかは確認すること