HOME/🔍 BigQuery/

🔍 100本ノック

Article Outline

|| データサイエンス100本ノック(構造化データ加工編) SQL編

| S-091 ★★★

顧客テーブル(customer)の各顧客に対し、売上実績がある顧客数と売上実績がない顧客 数が1:1となるようにアンダーサンプリングで抽出せよ。

| S-092 ★

顧客テーブル(customer)では、性別に関する情報が非正規化の状態で保持されている。 これを第三正規化せよ。

| S-093 ★

商品テーブル(product)では各カテゴリのコード値だけを保有し、カテゴリ名は保有し ていない。カテゴリテーブル(category)と組み合わせて非正規化し、カテゴリ名を保有 した新たな商品テーブルを作成せよ。

| S-094 ★

先に作成したカテゴリ名付き商品データを以下の仕様でファイル出力せよ。出力先のパス は"/tmp/data"を指定することでJupyterの"/work/data"と共有されるようになっている。 なお、COPYコマンドの権限は付与済みである。

  • ファイル形式はCSV(カンマ区切り)
  • ヘッダ有り
  • 文字コードはUTF-8

| S-095 ★

先に作成したカテゴリ名付き商品データを以下の仕様でファイル出力せよ。出力先のパス は"/tmp/data"を指定することでJupyterの"/work/data"と共有されるようになっている。 なお、COPYコマンドの権限は付与済みである。

  • ファイル形式はCSV(カンマ区切り)
  • ヘッダ有り
  • 文字コードはSJIS

| S-096 ★

先に作成したカテゴリ名付き商品データを以下の仕様でファイル出力せよ。出力先のパス は"/tmp/data"を指定することでJupyterの"/work/data"と共有されるようになっている。 なお、COPYコマンドの権限は付与済みである。

  • ファイル形式はCSV(カンマ区切り)
  • ヘッダ無し
  • 文字コードはUTF-8

| S-097 ★

先に作成した以下形式のファイルを読み込み、テーブルを作成せよ。また、先頭3件を表 示させ、正しくとりまれていることを確認せよ。

  • ファイル形式はCSV(カンマ区切り)
  • ヘッダ有り
  • 文字コードはUTF-8

| S-098 ★

先に作成した以下形式のファイルを読み込み、テーブルを作成せよ。また、先頭3件を表 示させ、正しくとりまれていることを確認せよ。

  • ファイル形式はCSV(カンマ区切り)
  • ヘッダ無し
  • 文字コードはUTF-8

| S-099 ★

先に作成したカテゴリ名付き商品データを以下の仕様でファイル出力せよ。出力先のパス は"/tmp/data"を指定することでJupyterの"/work/data"と共有されるようになっている。 なお、COPYコマンドの権限は付与済みである。

  • ファイル形式はTSV(タブ区切り)
  • ヘッダ有り
  • 文字コードはUTF-8

| S-100 ★

先に作成した以下形式のファイルを読み込み、テーブルを作成せよ。また、先頭10件を表 示させ、正しくとりまれていることを確認せよ。

  • ファイル形式はTSV(タブ区切り)
  • ヘッダ有り
  • 文字コードはUTF-8