一般社団法人データサイエンティスト協会から公開されているデータサイエンス100本ノック 構造化データ加工編ですが、コミュニティでもウィークリーチャレンジ方式でやってみたいと思いますので、興味のある方は参加いただければと思います。
初回は1問目~4問目を一つにまとめてみました。非常に簡単なデータ抽出の問題です。
- P-001: レシート明細データ(receipt.csv)から全項目の先頭10件を表示し、どのようなデータを保有しているか目視で確認せよ。
- P-002: レシート明細データ(receipt.csv)から売上年月日(sales_ymd)、顧客ID(customer_id)、商品コード(product_cd)、売上金額(amount)の順に列を指定し、10件表示せよ。
- P-003: レシート明細データ(receipt.csv)から売上年月日(sales_ymd)、顧客ID(customer_id)、商品コード(product_cd)、売上金額(amount)の順に列を指定し、10件表示せよ。ただし、sales_ymdsales_dateに項目名を変更しながら抽出すること。
- P-004: レシート明細データ(receipt.csv)から売上日(sales_ymd)、顧客ID(customer_id)、商品コード(product_cd)、売上金額(amount)の順に列を指定し、以下の条件を満たすデータを抽出せよ。
・顧客ID(customer_id)が"CS018205000001"
解いたらこちらに投稿していただければと思います。ちなみに、次回投稿は一週間後を予定しています。
solutionファイルは次回添付します。