[pandas] タグが付いた質問
Pythonにおいて、Rにおけるデータフレームに似た型を持たせることができるライブラリ。 データ構造を変更したりデータ分析したりするときにも便利である。BSDライセンスのもとで提供されている。
432 件の質問
6
票
3
回答
6,516
閲覧数
pythonのPandasで、縦持ちのデータを横持ちにするよい方法を教えてください。
python初心者です。
いろいろ調べながら進めているのですが、どうしてもすっきりしないので、どなたか教えていただけませんでしょうか?
◆Pandasのデータフレームで、縦持ちのデータを横持ちに変換する方法です。
以下のような縦持ちのデータがあるとします。(csvから読み込み)
ID number item
0 A 111 nn
1 A 123 mm
2 A 211 ...
5
票
3
回答
619
閲覧数
pandas, numpyでの積分・線形保管の処理を高速化したい
Pythonで数値解析のソフトウェアを作成しているのですが、処理に時間が掛かっており高速化したいと考えています。
cProfileで解析したところ、以下のintegrate()とscipyのinterp1dという2つの関数で全体の約47%の処理時間を占めていることが分かりました(total: 54.4 s, integrate: 14.7 s, interp1d: 11.2 s)。
...
4
票
2
回答
272
閲覧数
pandasの2次元配列から、1の値が入っている行、列番号を列挙する方法
2値の値が入っているnumpy arrayがあります。
そのarrayから1の値が入っている行と列番号を列挙したいです。
イメージ
以下のようなdataframeデータがあるとします
df = pd.DataFrame(np.array([[0,0,1],[1,0,1],[4,0,1]]))
df.index = [0, 1, 4]
これは以下のような表になると思います。
...
4
票
1
回答
1万
閲覧数
anacondaでpandasを使うモジュールをpyinstallerでexe化出来ない
pandasを使ったモジュールをexe化しようとしても上手く行かずに困っています。
Traceback (most recent call last):
File "site-packages\PyInstaller\loader\rthooks\pyi_rth_pkgres.py", line 11, in <module>
File "c:\users\Username\...
4
票
1
回答
97
閲覧数
文字列の数字への置き換え
現在、xに入っている路線名を、辞書line_namesにあるような数字に置き換えたいと考えています。
その際に、xにある路線名以外は、全て欠損値nanにしたいです。
現在は、line_namesのリストと、データとの対応が不完全なので、エラーになりますが、
辞書line_namesに対応を書かずとも、辞書にない文字列は、
欠損値としたいのですが、ご教示頂けるとありがたいです。
大量なデータがあり、...
4
票
1
回答
175
閲覧数
python 列と行のデータを照らし合わせて集計したい
データ前処理でどうしても解決できない部分があり質問させていただきます。
2つのテーブルで1つはユーザーIDに基づいたテレビ番組の視聴データ(0:見てない 1:見た)、
2つ目は上記テレビ番組のIDに基づいたCMの出稿データとなっており、製品名、会社名はダミーにしております。
今回やろうとしていることは製品ごとに出稿されたCMをユーザーがいくつ見たのかを集計したく
Aという製品は〇回、Bという製品は〇...
4
票
1
回答
940
閲覧数
pandasで単独の要素に値を代入する際のiatとilocの違いについて ValueError: could not convert string to float:
単独の要素に値を代入する際のiatとilocの違いについて
df1 = pd.DataFrame([[np.nan, 2], [1, 3], [4, 6]], columns=['A', 'B'])
df2 = pd.DataFrame([['aaa', 'bbb'], [1, 3], [4, 6]], columns=['A', 'B'])
A B
0 NaN 2
1 1....
4
票
1
回答
1,848
閲覧数
pandas 別のデータフレームにあるデータのみにフラグを付けたい
タイトルが分かりにくくて恐縮ですが、例えば以下の3個のデータフレームがあったとします。
・df_count
|日付|件数|
|2016-04-01|100|
|2016-04-02|1000|
|2016-04-03|300|
|2016-04-04|1500|
・df_CP1
|日付|キャンペーン名|
|2016-04-02|CP1|
・df_CP2
|日付|キャンペーン名|
|2016-...
3
票
2
回答
7,637
閲覧数
.txtファイルを.csvファイルに変換したい
python3.6環境下で以下の.csvファイルを出力しました。これをカンマ(,)区切りの.csvファイルに変換したいのですがうまくいきません。zepp.csv の一行1列目の要素には a b c d e f が格納されており、区切りが空白なのです。これらをカンマ区切りで a, b, c, d, e, f に訂正するアルゴリズムを各成分に対して適用するコードが書きたいです。...
3
票
3
回答
322
閲覧数
日付データから、月、日にちのデータを作成したい
日付データから、月、日にちのデータを作成したく、次のようなコードを準備しています。
import re
import pandas as pd
import datetime
df = pd.DataFrame(
{'x': ['Fri, 10 Mar 2017 23:58:00 GMT',
'Sat, 11 Mar 2017 05:33:42 GMT',
...
3
票
2
回答
803
閲覧数
python pandasデータフレームで条件から得た値を書き換えるには?その位置情報が分かればできるのだろうが、それがわからない。
素人質問で申し訳ないです。
pandasデータフレームで条件に当てはまる数値を任意の数値(または文字)に書き換えたい場合どのようにすればよいのでしょうか。
df = pd.DataFrame({'A': [0, 0, 2, 1], 'B': [1,2,3,4], 'C' : [5,7,2,5]},index = ["AA","BB","CC","DD"])
print (df)
...
3
票
1
回答
3,639
閲覧数
Pandas.DataFrame.Plotで描写した折れ線グラフについて、x軸の途中から色を変えたい。
Pandas.DataFrame.Plotで描写した折れ線グラフについて、x軸の途中から色を変えたいです。
以下で例えばx軸が3以上の場合に折れ線の色を赤色に変えるにはどうすれば良いでしょうか。
同様の質問が見つからず、ご教授下さい。
import pandas as pd
a = {'x-axis':[1,2,3,4,5], 'y-axis':[1,2,3,4,5]}
df = pd....
3
票
2
回答
1万
閲覧数
seaborn scatterplotにおいて、凡例(hue)に数値のものをいれるとプロット色が濃淡になってしまう
seaborn のversion0.10.0を使用しております。
seaborn scatterplotにおいて、凡例(hue)に数値のものをいれるとプロット色が濃淡になってしまいます。
やりたいこととしては出力図の凡例をカラフルな色にしたいと考えております。
通常はカラフルになるのですが、凡例対象が数値であるため濃淡なものになってしまいます。
図にしたいデータ
現在の出力図
sns....
3
票
1
回答
1,745
閲覧数
Pythonのpandasで一列だけrenameする方法
Pythonで指定した一列だけrenameする方法を探しています。
df.columns[0]='新列名'
としてもrenameできません。
ぐぐると全列名をリストで入れる方法と辞書で指定する方法は出てくるのですが、今回は使えません。
というのも、列名ではなく数値で列を指定しているのは関数化してループさせたときに1回目と2回目では列名が異なってくる、列数が異なってくるからです。
(...
3
票
1
回答
3,974
閲覧数
Pandasのapplyメソッドを使って列の文字列に対してMeCabで形態素解析をしたい。
英語版で質問しましたが回答が得られそうにないので、こちらで質問させていただきます。
https://stackoverflow.com/questions/48286364/pandas-series-apply-doesnt-work-consist-of-strings/48292467?noredirect=1#comment83570234_48292467
...