チャレンジ #64: データクレンジングで論文の著者名を抽出しましょう
オプション
- RSS フィードを購読する
- トピックを新着としてマーク
- トピックを既読としてマーク
- このトピックを現在のユーザーにフロートします
- ブックマーク
- 購読
- ミュート
- 印刷用ページ
SaoriG
Alteryx Alumni (Retired)
05-18-2020
04:13 PM
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
先週のチャレンジの解答はこちらをご覧ください。
今週はデータの解析に挑戦しましょう!
分析コンサルティング会社が、Web から医学雑誌の出版データをダウンロードし、リストされたエントリの著者をすべて抽出したいと考えています。
入力テキストには、記事の著者名を示すFAU(Full Author )と各記事の詳細が含まれています。ほとんどの場合記事には複数の著者がいます。
各記事の詳細は PMID で始まり空の行で終わります。
各記事 を PMID で解析し、Results.yxmd ファイルに示すように、各著者名が連続する列になるようにリストしてください。
Source: Giphy
14 - Magnetar
05-18-2020
04:45 PM
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
SaoriGさん
お題のワークフローが添付されていないです。
(今週の英語版のWeekly Challengeを解きましたが、違う問題で残念!)
05-18-2020
04:55 PM
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
すみません。なぜか相対パスで保存してもエラーがでるので悩んでいました。エラーがでても、開くときに相対パスを選択すると開けると思うのですが、もし問題があったらお知らせください。
14 - Magnetar
05-18-2020
04:59 PM
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
SaoriGさん、とりあえず開けました。後でやってみます。
⇒ できました。
スポイラ
簡単と思ったのですが、Crew TestでErrorが出ています。
見た感じ答えは一致していそうなのですが、どこがおかしいかわからず。後でKanemotoさんの回答を覗いてみます。
⇒原因わかりました。名前が想定より長く文字が途中で途切れていました。やはりCrew Testは正しいですね。

見た感じ答えは一致していそうなのですが、どこがおかしいかわからず。後でKanemotoさんの回答を覗いてみます。
⇒原因わかりました。名前が想定より長く文字が途中で途切れていました。やはりCrew Testは正しいですね。
ykanemoto
アステロイド
05-18-2020
05:46 PM
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
やってみました。
スポイラ
おかげで、Case Sensitiveオプションのことを思い出すことができました。

17 - Castor
05-18-2020
05:59 PM
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
21 - Polaris
05-18-2020
09:35 PM
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
やり方色々あるみたいですね。
Tokimatsu
クエーサー
05-18-2020
10:29 PM
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
今週のデータはいろんな情報が入っていて面白そうですが、やることは単純でした。
スポイラ
最近やたらと正規表現を使っている気がします。

21 - Polaris
05-19-2020
07:12 PM
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
やはり正規表現はパワフルですね.