Perl HTML::Tree

http://search.cpan.org/~petek/HTML-Tree-3.23/
HTMLの中の特定のタグからデータ(テキスト)を抜き出せたらいいなぁ・・・と、何気なくキーワードをGoogleに食わせていたら、Perlの HTML::Tree (及びその関連)を使えば、文書構造を取り出して、それに手を加えてテキストを抜き出せそうなことを発見。「素晴らしい!」と一瞬喜んだものの、Perlを動作させられない(環境的に動かすわけにはいかない)ので断念。
同じことを、VBVBAでできれば、WindowsのLocalマシン内で完結する仕組みが作れそうなのですが。そして食わせたいデータというのがこれまた曲者で・・・Officeアプリ(WORD、EXCEL)からHTML化した恐怖のソースコード。強敵。