Community Spring Cleaning week is here! Join your fellow Maveryx in digging through your old posts and marking comments on them as solved. Learn more here!
Free Trial

ウィークリーチャレンジ

トップになるためのスキルをお持ちですか? ウィークリーチャレンジを購読しましょう。ベストを尽くして問題を解決し、解決策を共有して、他のユーザーがどのように同じ問題に取り組んだのか確認しましょう。私たちも解答例を共有しています。

チャレンジ #64: データクレンジングで論文の著者名を抽出しましょう

SaoriG
Alteryx Alumni (Retired)

先週のチャレンジの解答はこちらをご覧ください。

 

今週はデータの解析に挑戦しましょう!

 

分析コンサルティング会社が、Web から医学雑誌の出版データをダウンロードし、リストされたエントリの著者をすべて抽出したいと考えています。

入力テキストには、記事の著者名を示すFAU(Full Author )と各記事の詳細が含まれています。ほとんどの場合記事には複数の著者がいます。

各記事の詳細は PMID で始まり空の行で終わります。

 

各記事 を PMID で解析し、Results.yxmd ファイルに示すように、各著者名が連続する列になるようにリストしてください。

 

Source: Giphy

DaisukeTsuchiya
パルサー

SaoriGさん
お題のワークフローが添付されていないです。
(今週の英語版のWeekly Challengeを解きましたが、違う問題で残念!)

SaoriG
Alteryx Alumni (Retired)

すみません。なぜか相対パスで保存してもエラーがでるので悩んでいました。エラーがでても、開くときに相対パスを選択すると開けると思うのですが、もし問題があったらお知らせください。

DaisukeTsuchiya
パルサー

SaoriGさん、とりあえず開けました。後でやってみます。

⇒ できました。

スポイラ
簡単と思ったのですが、Crew TestでErrorが出ています。
見た感じ答えは一致していそうなのですが、どこがおかしいかわからず。後でKanemotoさんの回答を覗いてみます。

⇒原因わかりました。名前が想定より長く文字が途中で途切れていました。やはりCrew Testは正しいですね。

capture.PNG
ykanemoto
アステロイド

やってみました。

スポイラ
おかげで、Case Sensitiveオプションのことを思い出すことができました。
challenge-64-ja-ykanemoto.png

AkimasaKajitani
17 - Castor
17 - Castor

結構シンプルな問題でした!

 

スポイラ
RegEx(正規表現)でさくっと・・・。

クリップボード一時ファイル06.png

Qiu
20 - Arcturus
20 - Arcturus

やり方色々あるみたいですね。

スポイラ
Jp-64.PNG
Tokimatsu
クエーサー

今週のデータはいろんな情報が入っていて面白そうですが、やることは単純でした。

スポイラ
最近やたらと正規表現を使っている気がします。
challenge_jp_64.PNG

ozawa
ACE Emeritus
ACE Emeritus

社内のweb会議システムで配信しながら実装してたのですが、特に盛り上がるポイントがなく完成してしまったのが残念です。

次回は頑張って苦戦します。

 

スポイラ
wc64.png
Qiu
20 - Arcturus
20 - Arcturus

やはり正規表現はパワフルですね.

regular_expressions.png