Skip to main content

[pandas] タグが付いた質問

Pythonにおいて、Rにおけるデータフレームに似た型を持たせることができるライブラリ。 データ構造を変更したりデータ分析したりするときにも便利である。BSDライセンスのもとで提供されている。

6
3 回答
6,516 閲覧数

python初心者です。 いろいろ調べながら進めているのですが、どうしてもすっきりしないので、どなたか教えていただけませんでしょうか? ◆Pandasのデータフレームで、縦持ちのデータを横持ちに変換する方法です。 以下のような縦持ちのデータがあるとします。(csvから読み込み)   ID number item 0  A  111  nn 1  A  123  mm 2  A  211  ...
YYTT's user avatar
  • 71
5
3 回答
619 閲覧数

Pythonで数値解析のソフトウェアを作成しているのですが、処理に時間が掛かっており高速化したいと考えています。 cProfileで解析したところ、以下のintegrate()とscipyのinterp1dという2つの関数で全体の約47%の処理時間を占めていることが分かりました(total: 54.4 s, integrate: 14.7 s, interp1d: 11.2 s)。 ...
Stack User's user avatar
4
2 回答
272 閲覧数

2値の値が入っているnumpy arrayがあります。 そのarrayから1の値が入っている行と列番号を列挙したいです。 イメージ 以下のようなdataframeデータがあるとします df = pd.DataFrame(np.array([[0,0,1],[1,0,1],[4,0,1]])) df.index = [0, 1, 4] これは以下のような表になると思います。 ...
ktakita's user avatar
  • 199
4
1 回答
1万 閲覧数

pandasを使ったモジュールをexe化しようとしても上手く行かずに困っています。 Traceback (most recent call last): File "site-packages\PyInstaller\loader\rthooks\pyi_rth_pkgres.py", line 11, in <module> File "c:\users\Username\...
Nadare's user avatar
  • 123
4
1 回答
97 閲覧数

現在、xに入っている路線名を、辞書line_namesにあるような数字に置き換えたいと考えています。 その際に、xにある路線名以外は、全て欠損値nanにしたいです。 現在は、line_namesのリストと、データとの対応が不完全なので、エラーになりますが、 辞書line_namesに対応を書かずとも、辞書にない文字列は、 欠損値としたいのですが、ご教示頂けるとありがたいです。 大量なデータがあり、...
kazusumi's user avatar
  • 270
4
1 回答
175 閲覧数

データ前処理でどうしても解決できない部分があり質問させていただきます。 2つのテーブルで1つはユーザーIDに基づいたテレビ番組の視聴データ(0:見てない 1:見た)、 2つ目は上記テレビ番組のIDに基づいたCMの出稿データとなっており、製品名、会社名はダミーにしております。 今回やろうとしていることは製品ごとに出稿されたCMをユーザーがいくつ見たのかを集計したく Aという製品は〇回、Bという製品は〇...
issei's user avatar
  • 81
4
1 回答
940 閲覧数

単独の要素に値を代入する際のiatとilocの違いについて df1 = pd.DataFrame([[np.nan, 2], [1, 3], [4, 6]], columns=['A', 'B']) df2 = pd.DataFrame([['aaa', 'bbb'], [1, 3], [4, 6]], columns=['A', 'B']) A B 0 NaN 2 1 1....
Asagao's user avatar
  • 83
4
1 回答
1,848 閲覧数

タイトルが分かりにくくて恐縮ですが、例えば以下の3個のデータフレームがあったとします。 ・df_count |日付|件数| |2016-04-01|100| |2016-04-02|1000| |2016-04-03|300| |2016-04-04|1500| ・df_CP1 |日付|キャンペーン名| |2016-04-02|CP1| ・df_CP2 |日付|キャンペーン名| |2016-...
ralirah's user avatar
  • 43
3
2 回答
7,637 閲覧数

python3.6環境下で以下の.csvファイルを出力しました。これをカンマ(,)区切りの.csvファイルに変換したいのですがうまくいきません。zepp.csv の一行1列目の要素には a b c d e f が格納されており、区切りが空白なのです。これらをカンマ区切りで a, b, c, d, e, f に訂正するアルゴリズムを各成分に対して適用するコードが書きたいです。...
wakewakameman's user avatar
3
3 回答
322 閲覧数

日付データから、月、日にちのデータを作成したく、次のようなコードを準備しています。 import re import pandas as pd import datetime df = pd.DataFrame( {'x': ['Fri, 10 Mar 2017 23:58:00 GMT', 'Sat, 11 Mar 2017 05:33:42 GMT', ...
kazusumi's user avatar
  • 270
3
2 回答
803 閲覧数

素人質問で申し訳ないです。 pandasデータフレームで条件に当てはまる数値を任意の数値(または文字)に書き換えたい場合どのようにすればよいのでしょうか。 df = pd.DataFrame({'A': [0, 0, 2, 1], 'B': [1,2,3,4], 'C' : [5,7,2,5]},index = ["AA","BB","CC","DD"]) print (df) ...
Asagao's user avatar
  • 83
3
1 回答
3,639 閲覧数

Pandas.DataFrame.Plotで描写した折れ線グラフについて、x軸の途中から色を変えたいです。 以下で例えばx軸が3以上の場合に折れ線の色を赤色に変えるにはどうすれば良いでしょうか。 同様の質問が見つからず、ご教授下さい。 import pandas as pd a = {'x-axis':[1,2,3,4,5], 'y-axis':[1,2,3,4,5]} df = pd....
tmatsu's user avatar
  • 31
3
2 回答
1万 閲覧数

seaborn のversion0.10.0を使用しております。 seaborn scatterplotにおいて、凡例(hue)に数値のものをいれるとプロット色が濃淡になってしまいます。 やりたいこととしては出力図の凡例をカラフルな色にしたいと考えております。 通常はカラフルになるのですが、凡例対象が数値であるため濃淡なものになってしまいます。 図にしたいデータ 現在の出力図 sns....
ktakita's user avatar
  • 199
3
1 回答
1,745 閲覧数

Pythonで指定した一列だけrenameする方法を探しています。 df.columns[0]='新列名' としてもrenameできません。 ぐぐると全列名をリストで入れる方法と辞書で指定する方法は出てくるのですが、今回は使えません。 というのも、列名ではなく数値で列を指定しているのは関数化してループさせたときに1回目と2回目では列名が異なってくる、列数が異なってくるからです。 (...
user87562's user avatar
  • 973
3
1 回答
3,974 閲覧数

英語版で質問しましたが回答が得られそうにないので、こちらで質問させていただきます。 https://stackoverflow.com/questions/48286364/pandas-series-apply-doesnt-work-consist-of-strings/48292467?noredirect=1#comment83570234_48292467 ...
YOSUKE's user avatar
  • 321

15 30 50 件 / ページ
1
2 3 4 5
29