🔍 100本ノック
|| データサイエンス100本ノック(構造化データ加工編) SQL編
| S-091 ★★★
顧客テーブル(customer)の各顧客に対し、売上実績がある顧客数と売上実績がない顧客 数が1:1となるようにアンダーサンプリングで抽出せよ。
| S-092 ★
顧客テーブル(customer)では、性別に関する情報が非正規化の状態で保持されている。 これを第三正規化せよ。
| S-093 ★
商品テーブル(product)では各カテゴリのコード値だけを保有し、カテゴリ名は保有し ていない。カテゴリテーブル(category)と組み合わせて非正規化し、カテゴリ名を保有 した新たな商品テーブルを作成せよ。
| S-094 ★
先に作成したカテゴリ名付き商品データを以下の仕様でファイル出力せよ。出力先のパス は"/tmp/data"を指定することでJupyterの"/work/data"と共有されるようになっている。 なお、COPYコマンドの権限は付与済みである。
- ファイル形式はCSV(カンマ区切り)
- ヘッダ有り
- 文字コードはUTF-8
| S-095 ★
先に作成したカテゴリ名付き商品データを以下の仕様でファイル出力せよ。出力先のパス は"/tmp/data"を指定することでJupyterの"/work/data"と共有されるようになっている。 なお、COPYコマンドの権限は付与済みである。
- ファイル形式はCSV(カンマ区切り)
- ヘッダ有り
- 文字コードはSJIS
| S-096 ★
先に作成したカテゴリ名付き商品データを以下の仕様でファイル出力せよ。出力先のパス は"/tmp/data"を指定することでJupyterの"/work/data"と共有されるようになっている。 なお、COPYコマンドの権限は付与済みである。
- ファイル形式はCSV(カンマ区切り)
- ヘッダ無し
- 文字コードはUTF-8
| S-097 ★
先に作成した以下形式のファイルを読み込み、テーブルを作成せよ。また、先頭3件を表 示させ、正しくとりまれていることを確認せよ。
- ファイル形式はCSV(カンマ区切り)
- ヘッダ有り
- 文字コードはUTF-8
| S-098 ★
先に作成した以下形式のファイルを読み込み、テーブルを作成せよ。また、先頭3件を表 示させ、正しくとりまれていることを確認せよ。
- ファイル形式はCSV(カンマ区切り)
- ヘッダ無し
- 文字コードはUTF-8
| S-099 ★
先に作成したカテゴリ名付き商品データを以下の仕様でファイル出力せよ。出力先のパス は"/tmp/data"を指定することでJupyterの"/work/data"と共有されるようになっている。 なお、COPYコマンドの権限は付与済みである。
- ファイル形式はTSV(タブ区切り)
- ヘッダ有り
- 文字コードはUTF-8
| S-100 ★
先に作成した以下形式のファイルを読み込み、テーブルを作成せよ。また、先頭10件を表 示させ、正しくとりまれていることを確認せよ。
- ファイル形式はTSV(タブ区切り)
- ヘッダ有り
- 文字コードはUTF-8