%matplotlib inline
import pandas as pd
import matplotlib.pyplot as plt
ご自身のPCで読み込む場合はダウンロードして解凍したファイルのパスを指定してください
datacsvpath = 'D:/HistoryData/TradeIsland/merge_data.csv'
namecsvpath = 'D:/HistoryData/TradeIsland/username.csv'
df = pd.read_csv(datacsvpath, index_col='date')
df.head()
もしかしたら、ID名も気になる、という人がいるかもしれないので
ハッシュ値みたいのに対応したユーザ名の辞書もついでに作りました
namedict = pd.read_csv(namecsvpath).set_index('uid')['name'].to_dict()
for k,v in namedict.items()[:10]:
print k, v
oku = (lambda x:x[x>=100000000])(df['profit'].groupby(df['uid']).sum()).sort_values(ascending=False)
print 'データ数', len(oku)
oku.plot.bar(figsize=(15,5))
plt.xticks(rotation=270)
for i,v in enumerate(oku.index):
print '{:2d}位 {:10.0f}円 {}'.format(i+1, oku[v], namedict[v])
q = 'stock_n{0:}{1:}future_n{0:}{1:}fx_n{0:}{1:}fxop_n{0:}{1:}c365_n{0:}{1:}cfd_n{0:}'.format('>0', '|')
print 'ユーザIDの個数', df['uid'].nunique()
print '1度でも取引があるID数', df.query(q)['uid'].nunique()
このデータより過去にトレードしたIDか、登録だけしてこの業者では取引はしていないIDってことかもしれませんね
print df['profit'].sum()
df['profit'].groupby(df.index).sum().plot.bar(figsize=(15,5))
トレーダーの収支を合計すると30億弱となっていますね
以前集計したときは+側に貢献しているのは主に株式のトレーダーだった記憶があります
株メイン、FXメイン、バイナリメインのトレーダーに分けてから集計してみると
日経やドル円が大きく動いた月の収益の傾向が見えたり
バイナリオプションの人たちはなかなか苦労してそうやのう(´・ω・`)
ってのが見えたりして面白いので興味がある人はpandasの練習がてら集計してみるのも面白いかもしれません
(いやRやexcelなんかでもよいか)