こんにちは、Maveryx!
先週のチャレンジの回答はこちらで見つけることができます。
少し前にこのチャレンジを提出いただいたMark Thompson(@Watermark)さんに心から感謝いたします。これは、ユーザーにとって正規表現ツールをテストしスキルを強化する素晴らしい機会です。
あなたの会社は最近、新しい顧客管理システム(CRM)を導入しましたが、新しいCRMシステムの企業レコードをどのように既存の財務システムに紐付けるという重要なことを見落としていました。これらのシステム間の共通のキーは企業のURLですが、営業チームがCRMに入力したWEBサイトのデータは一貫性がなく、かなりの部分が不正確になっています。
この問題の解決責任者としてのあなたのタスクは以下のとおりです:
ヒント:国を特定するために、URL内で2文字のトップレベルドメイン(TLD)コードを探します。他のコード(.com、.net、.orgなど)は米国に拠点を置く企業に関連付けられると仮定します
hi @AYXAcademy Could you share the stat file in yxzp format? It seems that input files are Excel and CSV format. Thanks!
チャレンジャーのみなさま
英語版の411のインプットファイルになるので、こちらを使っていただければ・・・。
@AYXAcademy Please contain the input file for the start workflow.
できました!正直この問題は答えに合わせきれないです・・・。
いやー、むずいっすね・・・。
やってみました、・・・がなんだか合わないです
今回がわたしの最後のチャレンジとなります!
タスク1で完全一致させたところで力尽きました。
「正しいデータの在り方」について改めて考えさせてくれる、いいお題でした。
Brute Forceです。全件クロスジョインして、以下のRegexマッチで判定します(答えに合わせるように何度も修正しました)
REGEX_Match([Website], "(.*/|.*w\.|.*w\d+\.|.*www|.*@|^)"+[Finance URL]+".*") and !IsNull([CompanyNumber])
正規表現一発で全カラムパースに挑戦してみました。
一回作った後、正規表現だけでパースできるように頑張ってみました。正規表現だけだと null のデータを作れないし、カラムの順番も指定できなかったのでその分追加してます。謎の呪文になってて可読性悪すぎ(^^;
^(http://|https://|)(WW+\d?\.|)(([^/?:]*?)\.?([^/?:.]*\.([^/?:.]*)))([?/:].*|)$