どこで興味深いチャレンジに遭遇するのか分からないものです。
以下は "XML Parsing for Beginners"という投稿に対する回答として投稿されました。
「私はある項目 (item) に関する情報を含むファイルを持っています(サンプルが以下にあります)。私の仕事は、item_identifier を特定の属性に関連付けるリストを生成することです(例えば、このサンプルから、以下の出力テーブルのようなものを作成します):
item_identifier | grade_level | subject | Depth of Knowledge | Bloom's Taxonomy | etc etc
つまり、基本的にはすべての<source><langstring>をタイトルとして、<taxon><entry>を値として持つテーブルです。 その後、少し複雑になりますが、<source><langstring>Standard に到達した後、すべての値を求めてください。」
今年のWeekly Challengeは先週でおしまいなのかなと思っていたら出てきましたね。
「同じ名前で異なる値を持つ倍数と、すべての値を求めてください。」の意味が分からなくて英語サイトを見に行ってしまいました。「同じ名前で異なる値がでてきますが、すべての値を表示させてください。」の方がわかりやすいと思います。
それでは皆さん良いお年を。
正規表現で頑張ってみました。
@DaisukeTsuchiya さんのやり方をパクしました。
XMLって何?というチンプンカンプンな状態だったので、早々に諦めてsolutionカンニングしました。。。が、なんか分かったような、分からんような・・・笑 業務でもときどきXML形式のデータがあるようなので、これを機会に自習しようと思いました。
XMLのツリー構造を地道にたどっていくため、XML Parseツールだけで対応しましたが、拡張性があるかというと自信ありません。
データ構造が固定的であればこれでよいような気もしますが。。
Solutionも見ましたが、RegExツールで"Normalize XML for Parsing"といっている処理の内容が理解できませんでした。