从SQLServer解析XML文件

问题描述:

我收到了一个'xml'文件,虽然它看起来不像XML。我知道它是从Microsoft Access或SQLServer导出的。该文件看起来是这样的:从SQLServer解析XML文件

>>> contents[:1000] 
'\xef\xbb\xbf<?xml version="1.0"?><Report xmlns="Ascent_x0_Metadata_x0020_Report_x0020__x002ted" 
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
xsi:schemaLocation="Ascent_x0020_Me0_Repo29__x0020_updated http://reportserver? 
%2fAsata+Report+(by+Title+Letter)+updated&amp;rs%3aFormat=XML&amp;rc%3aSchema=True" 
Name="Ascent Report (by Title Letter) updated"> 
    <table1> 
     <Detail_Collection> 
      <Detail ISOCountry="AR" TitleSort="A Very Brady Sequel" 
       ReleaseYear="1996" TitleKind="N/A" TitleType="N/A"... 

此外,我甚至无法在TextMate打开这个文件 - 每次我尝试它的时候崩溃的程序。

+0

\ xef \ xbb \ xbf是我不知道这是否有帮助,但就是这样。它对我来说看起来像XML。在第一对字节中只有一些垃圾? – Dave 2013-02-14 06:37:26

第一个十六进制字符是UTF-8字节顺序标记(http://en.wikipedia.org/wiki/Byte_order_mark0xEF,0xBB,0xBF)。

这只是表示您收到的内容编码为UTF-8,您应该通过设置您用来阅读内容的编码来对待它。 XML文件的其余部分看起来没问题。

Textmate应该用UTF-8做得很好,但也许文件太大了。