もっとスマートに組めるかと思ったのですが、絶妙にめんどくさいデータが混じっておりうまくいかず・・・。
最後力ずくでなんとかしました。
こういったことが起きないデジタル社会であってほしいものです
最後微妙に合わなかったのですが、諦めました。最後まで、データのパターンが理解できませんでした。実務でこんなデータきたら、拒否します。笑
今回は相当苦労しました。
ただ、
・1行に1種類のデータしか入っていないケースをつぶしてから
・顧客単位に行をまとめて
・1行に複数のデータが入っているケースをつぶす
という風に処理を分割していくと、マッチ数が増えていくのが見えて「進んでいる」感じがするので
「比較的」ストレスを感じずに進められました。
しかし、新しいパターンが入ってきたら動くかどうかわかりません。
この種の品質が悪いデータを処理するときは、将来のメンテナンスを考えて見やすいワークフローにする必要がありますね...
あと、正規表現はもっとシンプルにできそうな気がしました。要勉強です...