HOME/📦 INBOX/

【🐍 Python】データサイエンス100本ノック(構造化データ加工編)

Article Outline
TOC
Collection Outline

Python編

| P-001

レシート明細のデータフレーム(df_receipt)から全項目の先頭10件を表示し、どのようなデータを保有しているか目視で確認せよ。

df_receipt.head(10)

| P-002

レシート明細のデータフレーム(df_receipt)から売上日(sales_ymd)、顧客ID(customer_id)、商品コード(product_cd)、売上金額(amount)の順に列を指定し、10件表示させよ。

df_receipt[["sales_ymd", "customer_id", "product_cd", "amount"]].head(10)

| P-003

レシート明細のデータフレーム(df_receipt)から売上日(sales_ymd)、顧客ID(customer_id)、商品コード(product_cd)、売上金額(amount)の順に列を指定し、10件表示させよ。ただし、sales_ymdはsales_dateに項目名を変更しながら抽出すること。

df_receipt[["sales_ymd", "customer_id", "product_cd", "amount"]].rename(columns={"sales_ymd":"sales_date"}).head(10)

| P-004

レシート明細のデータフレーム(df_receipt)から売上日(sales_ymd)、顧客ID(customer_id)、商品コード(product_cd)、売上金額(amount)の順に列を指定し、以下の条件を満たすデータを抽出せよ。

  • 顧客ID(customer_id)が"CS018205000001"
df_receipt[["sales_ymd", "customer_id", "product_cd", "amount"]].query('customer_id == "CS018205000001"')

| P-005

レシート明細のデータフレーム(df_receipt)から売上日(sales_ymd)、顧客ID(customer_id)、商品コード(product_cd)、売上金額(amount)の順に列を指定し、以下の条件を満たすデータを抽出せよ。

  • 顧客ID(customer_id)が"CS018205000001"
  • 売上金額(amount)が1,000以上

| P-006

レシート明細データフレーム「df_receipt」から売上日(sales_ymd)、顧客ID(customer_id)、商品コード(product_cd)、売上数量(quantity)、売上金額(amount)の順に列を指定し、以下の条件を満たすデータを抽出せよ。

  • 顧客ID(customer_id)が"CS018205000001"
  • 売上金額(amount)が1,000以上または売上数量(quantity)が5以上

| P-007

レシート明細のデータフレーム(df_receipt)から売上日(sales_ymd)、顧客ID(customer_id)、商品コード(product_cd)、売上金額(amount)の順に列を指定し、以下の条件を満たすデータを抽出せよ。

  • 顧客ID(customer_id)が"CS018205000001"
  • 売上金額(amount)が1,000以上2,000以下

| P-008

レシート明細のデータフレーム(df_receipt)から売上日(sales_ymd)、顧客ID(customer_id)、商品コード(product_cd)、売上金額(amount)の順に列を指定し、以下の条件を満たすデータを抽出せよ。

  • 顧客ID(customer_id)が"CS018205000001"
  • 商品コード(product_cd)が"P071401019"以外

| P-009

以下の処理において、出力結果を変えずにORをANDに書き換えよ。 df_store.query('not(prefecture_cd == "13" | floor_area > 900)')

| P-010

| P-011

| P-0

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00

| P-00