ようやく半分の50問を超えました!
一般社団法人データサイエンティスト協会から公開されているデータサイエンス100本ノック 構造化データ加工編のウィークリーチャレンジ方式による出題第9回目は46問目~51問目を一つにまとめてみました。今回は日付変換処理中心の問題です。
P-046: 顧客データ(customer.csv)の申し込み日(application_date)はYYYYMMDD形式の文字列型でデータを保有している。これを日付型に変換し、顧客ID(customer_id)とともに10件表示せよ。
P-048: レシート明細データ(receipt.csv)の売上エポック秒(sales_epoch)は数値型のUNIX秒でデータを保有している。これを日付型に変換し、レシート番号(receipt_no)、レシートサブ番号(receipt_sub_no)とともに10件表示せよ。
※出力する日付型のデータはsales_dateとする
P-049: レシート明細データ(receipt.csv)の売上エポック秒(sales_epoch)を日付型に変換し、「年」だけ取り出してレシート番号(receipt_no)、レシートサブ番号(receipt_sub_no)とともに10件表示せよ。
※出力するデータはsales_yearとする
P-050: レシート明細データ(receipt.csv)の売上エポック秒(sales_epoch)を日付型に変換し、「月」だけ取り出してレシート番号(receipt_no)、レシートサブ番号(receipt_sub_no)とともに10件表示せよ。なお、「月」は0埋め2桁で取り出すこと。
※出力するデータはsales_monthとする
P-051: レシート明細データ(receipt.csv)の売上エポック秒(sales_epoch)を日付型に変換し、「日」だけ取り出してレシート番号(receipt_no)、レシートサブ番号(receipt_sub_no)とともに10件表示せよ。なお、「日」は0埋め2桁で取り出すこと。
※出力するデータはsales_dayとする
解いたらこちらに投稿していただければと思います。ちなみに、次回投稿は一週間後を予定しています。
solutionファイルは次回添付します。
添付ファイルは今回の出題のstartファイルと、前回のsolutionファイルです。
前回:データサイエンス100本ノック 構造化データ加工編をAlteryxでやってみる(39問目~45問目:集計・データ結合・レコード間処理編)
出題ありがとうございます。
エポック秒ってステキな名前。。。
折り返し地点にきました