HTMLパーサでXMLの処理は

普通はできない

通常できないはずです。なぜなら、Mozilla以外のブラウザ、つまり、OperaIEは特殊な処理をしながら、HTMLの解析を行っています。もしかしたら、SVGぐらいなら埋め込んで処理できるかもと思っています。
整理とメモのために、各自ブラウザの処理を見ていきます。

Operaの場合

見知らぬ要素(例えば、HTMLにはないhogehogeやhoge要素)があれば、タグをbody要素の最後まで閉じようとしません。前の要素(例:p要素)の子要素として入れてしまいます。



<p>eo</p>


オペラで処理後

 
  <p>eo</p>
 


IE6の場合

見知らぬ要素であったとしても、接頭語に名前空間(例:s:hogehoge要素)がついていれば、タグを正しく閉じます。もし、なければ、文字(アルファベット)を大文字にして、タグをその場で閉じてしまいます。また、終了タグそのものも勝手に閉じてしまいます。

<p>eo</p>
 
  
 
 
  
 

IEで処理後
<P>eo</P>
 
  
 
<!--注:上記は「/HOGEHOGE」という名前の要素を新たに作ってしまった-->
 
  
 

ちなみに、Mozillaは素直にタグを閉じていきます。XMLと同じようなDOMツリーを作成します。