Free Trial

ウィークリーチャレンジリポジトリ

トップになるためのスキルをお持ちですか? ウィークリーチャレンジを購読しましょう。ベストを尽くして問題を解決し、解決策を共有して、他のユーザーがどのように同じ問題に取り組んだのか確認しましょう。私たちも解答例を共有しています。

チャレンジ #64: データクレンジングで論文の著者名を抽出しましょう

SaoriG
Alteryx Alumni (Retired)

先週のチャレンジの解答はこちらをご覧ください。

 

今週はデータの解析に挑戦しましょう!

 

分析コンサルティング会社が、Web から医学雑誌の出版データをダウンロードし、リストされたエントリの著者をすべて抽出したいと考えています。

入力テキストには、記事の著者名を示すFAU(Full Author )と各記事の詳細が含まれています。ほとんどの場合記事には複数の著者がいます。

各記事の詳細は PMID で始まり空の行で終わります。

 

各記事 を PMID で解析し、Results.yxmd ファイルに示すように、各著者名が連続する列になるようにリストしてください。

 

Source: Giphy

DaisukeTsuchiya
マグネター

SaoriGさん
お題のワークフローが添付されていないです。
(今週の英語版のWeekly Challengeを解きましたが、違う問題で残念!)

SaoriG
Alteryx Alumni (Retired)

すみません。なぜか相対パスで保存してもエラーがでるので悩んでいました。エラーがでても、開くときに相対パスを選択すると開けると思うのですが、もし問題があったらお知らせください。

DaisukeTsuchiya
マグネター

SaoriGさん、とりあえず開けました。後でやってみます。

⇒ できました。

スポイラ
簡単と思ったのですが、Crew TestでErrorが出ています。
見た感じ答えは一致していそうなのですが、どこがおかしいかわからず。後でKanemotoさんの回答を覗いてみます。

⇒原因わかりました。名前が想定より長く文字が途中で途切れていました。やはりCrew Testは正しいですね。

capture.PNG
ykanemoto
アステロイド

やってみました。

スポイラ
おかげで、Case Sensitiveオプションのことを思い出すことができました。
challenge-64-ja-ykanemoto.png

AkimasaKajitani
17 - Castor
17 - Castor

結構シンプルな問題でした!

 

スポイラ
RegEx(正規表現)でさくっと・・・。

クリップボード一時ファイル06.png

Qiu
21 - Polaris
21 - Polaris

やり方色々あるみたいですね。

スポイラ
Jp-64.PNG
Tokimatsu
クエーサー

今週のデータはいろんな情報が入っていて面白そうですが、やることは単純でした。

スポイラ
最近やたらと正規表現を使っている気がします。
challenge_jp_64.PNG

ozawa
ACE Emeritus
ACE Emeritus

社内のweb会議システムで配信しながら実装してたのですが、特に盛り上がるポイントがなく完成してしまったのが残念です。

次回は頑張って苦戦します。

 

スポイラ
wc64.png
Qiu
21 - Polaris
21 - Polaris

やはり正規表現はパワフルですね.

regular_expressions.png