一般社団法人データサイエンティスト協会から公開されているデータサイエンス100本ノック 構造化データ加工編のウィークリーチャレンジ方式による出題第12回目は63問目~67問目を一つにまとめてみました。今回は計算中心の問題です。
P-063: 商品データ(product.csv)の単価(unit_price)と原価(unit_cost)から各商品の利益額を算出し、結果を10件表示せよ。
※出力は、フィールド名をunit_profitとすること
P-064: 商品データ(product.csv)の単価(unit_price)と原価(unit_cost)から、各商品の利益率の全体平均を算出せよ。ただし、単価と原価には欠損が生じていることに注意せよ。
※作成するフィールドの名称はprofit_rateとすること
P-065: 商品データ(product.csv)の各商品について、利益率が30%となる新たな単価を求めよ。ただし、1円未満は切り捨てること。そして結果を10件表示させ、利益率がおよそ30%付近であることを確認せよ。ただし、単価(unit_price)と原価(unit_cost)には欠損が生じていることに注意せよ。
※新しい価格はnew_price、新しい単価での利益率はnew_profit_rateというフィールド名とすること
P-066: 商品データ(product.csv)の各商品について、利益率が30%となる新たな単価を求めよ。今回は、1円未満を丸めること(四捨五入または偶数への丸めで良い)。そして結果を10件表示させ、利益率がおよそ30%付近であることを確認せよ。ただし、単価(unit_price)と原価(unit_cost)には欠損が生じていることに注意せよ。
※新しい価格はnew_price、新しい単価での利益率はnew_profit_rateというフィールド名とすること
P-067: 商品データ(product.csv)の各商品について、利益率が30%となる新たな単価を求めよ。今回は、1円未満を切り上げること。そして結果を10件表示させ、利益率がおよそ30%付近であることを確認せよ。ただし、単価(unit_price)と原価(unit_cost)には欠損が生じていることに注意せよ。
※新しい価格はnew_price、新しい単価での利益率はnew_profit_rateというフィールド名とすること
解いたらこちらに投稿していただければと思います。ちなみに、次回投稿は一週間後を予定しています。
solutionファイルは次回添付します。
添付ファイルは今回の出題のstartファイルと、前回のsolutionファイルです。
前回:データサイエンス100本ノック 構造化データ加工編をAlteryxでやってみる(58問目~62問目:データ変換編)
回答します。
前回は標準偏差などが出てきて「統計」という感じがしましたが、今回は「算数」ですね。
64問目:一応 !IsNull() でフィルタしようかと思いましたが、ヒントを見て外しました。
65問目
66問目
67問目
整数に丸めるにもいろいろな関数があるのすね。
他言語でRoundしか使っていなかったので勉強になりました。