Challenge #260: 新しいCRMシステムを既存の財務システムに紐付ける
- RSS フィードを購読する
- トピックを新着としてマーク
- トピックを既読としてマーク
- このトピックを現在のユーザーにフロートします
- ブックマーク
- 購読
- ミュート
- 印刷用ページ
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
こんにちは、Maveryx!
先週のチャレンジの回答はこちらで見つけることができます。
少し前にこのチャレンジを提出いただいたMark Thompson(@Watermark)さんに心から感謝いたします。これは、ユーザーにとって正規表現ツールをテストしスキルを強化する素晴らしい機会です。
あなたの会社は最近、新しい顧客管理システム(CRM)を導入しましたが、新しいCRMシステムの企業レコードをどのように既存の財務システムに紐付けるという重要なことを見落としていました。これらのシステム間の共通のキーは企業のURLですが、営業チームがCRMに入力したWEBサイトのデータは一貫性がなく、かなりの部分が不正確になっています。
この問題の解決責任者としてのあなたのタスクは以下のとおりです:
- 既存の財務システムの各企業を新しいCRMシステムの対応するレコードと照合します
- CRMシステムのデータを分析して「汚いデータ」(URL内にサブディレクトリを持つエントリ)が含まれているエントリの数を特定します
- データ統合プロセス中に一致した個別のWEBサイト(ベースURL)の数を特定します
- CRMシステムで複数の販売機会(2つ以上)を持つ米国内の企業を特定します(ヒント:ドメインのURLを使います)
- 米国外で複数の販売機会(2つ以上)を持つ企業を特定します
ヒント:国を特定するために、URL内で2文字のトップレベルドメイン(TLD)コードを探します。他のコード(.com、.net、.orgなど)は米国に拠点を置く企業に関連付けられると仮定します
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
hi @AYXAcademy Could you share the stat file in yxzp format? It seems that input files are Excel and CSV format. Thanks!
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
チャレンジャーのみなさま
英語版の411のインプットファイルになるので、こちらを使っていただければ・・・。
@AYXAcademy Please contain the input file for the start workflow.
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
できました!正直この問題は答えに合わせきれないです・・・。
しかし、CRM側にメールアドレス的なもの入れるなよって思いました(笑)まぁ、実際のところ「あるある」なんでしょうけど(笑)そういうどう考えても不正なやつがあると、正規表現一発解決、といかないですね・・・。
いやー、むずいっすね・・・。
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
やってみました、・・・がなんだか合わないです
今回がわたしの最後のチャレンジとなります!
ここでみなさまと勉強できて楽しかったです!ありがとうございました。
Alteryxは素晴らしいツールで、また使う機会があるといいなあ~と思います。
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
タスク1で完全一致させたところで力尽きました。
「正しいデータの在り方」について改めて考えさせてくれる、いいお題でした。
Brute Forceです。全件クロスジョインして、以下のRegexマッチで判定します(答えに合わせるように何度も修正しました)
REGEX_Match([Website], "(.*/|.*w\.|.*w\d+\.|.*www|.*@|^)"+[Finance URL]+".*") and !IsNull([CompanyNumber])
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
- 新着としてマーク
- ブックマーク
- 購読
- ミュート
- RSS フィードを購読する
- ハイライト
- 印刷
- モデレーターに通知する
正規表現一発で全カラムパースに挑戦してみました。
一回作った後、正規表現だけでパースできるように頑張ってみました。正規表現だけだと null のデータを作れないし、カラムの順番も指定できなかったのでその分追加してます。謎の呪文になってて可読性悪すぎ(^^;
^(http://|https://|)(WW+\d?\.|)(([^/?:]*?)\.?([^/?:.]*\.([^/?:.]*)))([?/:].*|)$