Free Trial

ウィークリーチャレンジリポジトリ

トップになるためのスキルをお持ちですか? ウィークリーチャレンジを購読しましょう。ベストを尽くして問題を解決し、解決策を共有して、他のユーザーがどのように同じ問題に取り組んだのか確認しましょう。私たちも解答例を共有しています。

チャレンジ #281: オグデンのベーシック・イングリッシュ~単語のカウントを作りましょう

AYXAcademy
Alteryx
Alteryx

 

こんにちは、Maveryx

 

先週の課題の解決策はここで見つけることができます。

 

今週のチャレンジは、Motoi Tokimatsuさんからのもので、あなたの正規表現のスキルをテストするものです。 この興味深いタスクを作成いただきありがとうございます、@Tokimatsu さん!

 

Firefly generate a image of a book and write 850 words of Charles Kay Ogden's Basic English 98038.jpg850単語からなるCharles Kay Ogdenのベーシック・イングリッシュについて聞いたことはありますか?(この文脈において、BASICBritish American Scientific International Commercialの頭文字を取ったものです)。1930年に出版された彼の本「Basic English: A General Introduction with Rules and Grammar」では、彼はベーシック・イングリッシュの核となる語彙を形成するために約850単語のリストを作成しました。ベーシック・イングリッシュは、特に第二言語として英語を学んでいる人のために、国際的なコミュニケーションをより簡単で効率的にする英語の形を作ることを狙いとしています。語彙が削減されているため、完全な英語のような複雑さを感じることなく、日常のほとんどのシチュエーションやニーズをカバーするようにデザインされています。

 

このチャレンジのあなたのタスクは次のとおりです:

  1. 提供されたURLからデータをダウンロードする
  2. 850単語の単語をリストアップする
  3. それぞれの単語の頭文字のインデックスを作る
  4. それぞれのアルファベットで始まる単語の数をカウントする

 

このチャレンジでは、正規表現の置換とトークナイズの機能が活躍します。

 

復習が必要であれば、アカデミーの次のレッスンで復習してください。

 

健闘を祈ります!

Yoshiro_Fujimori
オーロラ

@Tokimatsu さん Challenge問題 採用 おめでとうございます!

 

PC環境の制約で Download Tool が使えないため 便宜上 Web Browser で HTMLソース を表示してTextファイルに保存しました。

 

スポイラ
"G" と "P" が解答と1件ずつ 合わないのですが、いったん提出します。

Workflow
Challenge_281_ja_workflow.png
    Expect Equal (BETA) (67)    Unexpected Value - Field:Count Row:7 Expected:23 Actual:22
    Expect Equal (BETA) (67)    Unexpected Value - Field:Count Row:16 Expected:60 Actual:59


RegEx Tool 1
<div class="mw-heading mw-heading3">.*?\n<p>(.*?)\n<\/p>

RegEx Tool 2
<a.*?>(.*?)<\/a>
DaisukeTsuchiya
パルサー

数か所合いませんが、投稿します。

 

スポイラ
スクリーンショット 2024-08-07 134604.png
Tokimatsu
クエーサー

不親切な問題で失礼しました。

スポイラ
ページで数えると単語は854個あり、much more most と little less least をそれぞれ1と数えると、850個になります。
Index で合計する前に、単語リストを付けるべきでした。それでも不親切ですが。これかなり前に提出したお題で、
なんで合計が違ってるのか思い出せません。

ワークフローもやっつけになってしましました。


スクリーンショット 2024-08-07 194847.png



Qiu
21 - Polaris
21 - Polaris

@Tokimatsu 
採用おめでとうございます!

スポイラ
challenge_ja_281.png
AkimasaKajitani
17 - Castor
17 - Castor

できました!そもそも「Ogdenのベーシック・イングリッシュ」というのがあるというのを初めて知りました。 @Tokimatsu さん、勉強になります&採用おめでとうございます。

 

ちょこちょこ知らない単語があるので勉強しないとダメですね・・・。

 

スポイラ
いちおう合わない部分はWEBを見て確認しましたが、WEBとは一致確認済みです。

スクリーンショット 2024-08-10 143110.png


※ダウンロードツールでDCM使うときに、URLをDCM側にいれる場合は要注意です(DCMに入れたURLとURLで指定しているURLを合体して読み込むようになっているので)。

gawa
16 - Nebula
16 - Nebula

HTMLパースで苦労すると、Rest APIのありがたさが実感できますねぇ

スポイラ
以下のRegecでTokenizeすると、綺麗に取れました。\1は前にキャプチャされたグループの後方参照で、(\w+)と同じ文字列の場合にマッチします
title="wikt:(\w+)">\1</a>​

WFはシンプルです
image.png