如何从XML recurssively属性读取数据并将其存储在CSV在Java中

问题描述:

我有XML数据,如下所示,如何从XML recurssively属性读取数据并将其存储在CSV在Java中

<?xml version="1.0" encoding="ISO-8859-1"?> 
<FIXML xsi:schemaLocation="http://www.fixprotocol.org/FIXML-5-0-SP2 fixml-main-5-0-SP2_.xsd" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" s="2012-04-23" v="FIX.5.0SP2"> 
    <Batch ID="RPTTA111PUBLI20170509"> 
     <MktDef MktID="XEUR" MktSegID="14" EfctvBizDt="2017-05-11" NxtEfctvBizDt="2017-05-15" MktSeg="CONF" MarketSegmentDesc="FUT 8-13 Y. SWISS GOV.BONDS 6%" Sym="CH0002741988" ParentMktSegmID="FBND" Ccy="CHF" MktSegStat="1" USFirmFlag="Y" PartID="2"> 
      <MtchRules MtchRuleProdCmplx="5" MtchAlgo="PT" /> 
      <MtchRules MtchRuleProdCmplx="1" MtchAlgo="PT" /> 
      <FlexProdEligs FlexProdEligCmplx="5" FlexProdElig="Y" /> 
      <BaseTrdgRules QtSideInd="1" FastMktPctg="0"> 
       <TickRules TickRuleProdCmplx="1" StartTickPxRng="0" EndTickPxRng="99999.9999" TickIncr="0.01" /> 
       <TickRules TickRuleProdCmplx="5" StartTickPxRng="0" EndTickPxRng="99999.9999" TickIncr="0.01" /> 
       <QuotSizeRules MinBidSz="1" MinOfrSz="1" FastMktInd="0" /> 
       <QuotSizeRules MinBidSz="1" MinOfrSz="1" FastMktInd="1" /> 
       <PxRngRules PxRngRuleID="75" PxRngProdCmplx="1" StartPxRng="0" EndPxRng="99999.9999" PxRngValu="0.15" /> 
       <PxRngRules PxRngRuleID="347" PxRngProdCmplx="5" StartPxRng="0" EndPxRng="99999.9999" PxRngValu="0.12" /> 
      </BaseTrdgRules> 
      <MDFeedTyps MDFeedTyp="HS" MDBkTyp="2" MktDepth="10" MDRcvryTmIntvl="120000" SvcLctnID1="224.0.50.102" SvcLctnSubID1="59500" SvcLctnID2="224.0.50.230" SvcLctnSubID2="59500" /> 
      <MDFeedTyps MDFeedTyp="HI" MDBkTyp="2" MktDepth="10" MktDepthTmIntvl="0" SvcLctnID1="224.0.50.103" SvcLctnSubID1="59501" SvcLctnID2="224.0.50.231" SvcLctnSubID2="59501" /> 
      <MDFeedTyps MDFeedTyp="HI" MDBkTyp="3" MktDepthTmIntvl="0" SvcLctnID1="224.0.114.97" SvcLctnSubID1="59501" SvcLctnID2="224.0.114.113" SvcLctnSubID2="59501" /> 
      <MDFeedTyps MDFeedTyp="HS" MDBkTyp="3" SvcLctnID1="224.0.114.96" SvcLctnSubID1="59500" SvcLctnID2="224.0.114.112" SvcLctnSubID2="59500" /> 
      <MDFeedTyps MDFeedTyp="L" MDBkTyp="2" MktDepth="5" MktDepthTmIntvl="3500" MDRcvryTmIntvl="30000" SvcLctnID1="224.0.50.89" SvcLctnSubID1="59500" SvcLctnID2="224.0.50.217" SvcLctnSubID2="59500" /> 
     </MktDef> 
     <SecDef PriSetPx="158.39"> 
      <Instrmt ID="408805" Src="M" SecTyp="FUT" Status="1" ProdCmplx="1" CFI="FFMPSX" MatDt="2017-06-08" MMY="201706" Mult="1" ValMeth="FUT" SettlMeth="P" SettlSubMeth="4" PxPrcsn="2" MinPxIncr="0.01" MinPxIncrAmt="10"> 
       <AID AltID="1048612" AltIDSrc="M" /> 
       <AID AltID="XF000001RQD8" AltIDSrc="4" /> 
       <Evnt EventTyp="7" Dt="2017-06-08" /> 
      </Instrmt> 
      <MktSegGrp MktSegID="14"> 
       <SecTrdgRules> 
        <BaseTrdgRules> 
         <PxRngRules PxRngRuleID="75" /> 
        </BaseTrdgRules> 
       </SecTrdgRules> 
      </MktSegGrp> 
     </SecDef> 
    </Batch> 
</FIXML> 

我想从这个XML读取数据并将其存储在CSV文件下面。

列名应该是RootElementName_ChildElementName(如果有)_AttributeName。这种格式我应该遵循,

假设RootElement是FIXML,并且我们有属性“s”和“v”,所以列名应该如下FIXML_s,FIXML_v。

而且子元素批处理和MktDef列名应该是 FIXML_Batch_ID和FIXML_Batch_MktDef_MktID就像下面那样。

1) FIXML_s  FIXML_v  FIXML_Batch_ID  FIXML_Batch_MktDef_MktID . . . . . 
    "2012-04-23" "FIX.5.0SP2" RPTTA111PUBLI20170509 XEUR .... 
. 
. 
. 

我们有这样的数据,成千上万行的,当它到达的"</SecDef>"数据应在2号线和喜欢它继续第3行打印。

有人可以指导我这个。在处理XML数据方面我很新。

+0

那么是什么决定哪些属性形成结果的单行? –

+0

对于SecDef我们有PriSetPx,对于MktDef我们有MktSegID。基于这两个属性,我们将决定每次迭代的结果。 –

+0

请考虑简化您的XML代码片段,然后展示并解释您希望使用XSLT创建的完整对应CSV,并解释哪些元素及其属性映射到CSV中的一行。所有那些具有相同属性的'MDFeedTyps'应该会发生什么,它们都属于同一行还是属于不同行? –

你可以把这个作为样本 其中

你必须desgn自己 style.xsl

听到是我的

<?xml version="1.0"?> 
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:fo="http://www.w3.org/1999/XSL/Format"> 
    <xsl:output method="text" omit-xml-declaration="yes" indent="no" /> 
    <xsl:template match="/"> 
topic,title,url 
<xsl:for-each select="//topic"><xsl:value-of select="@id" /><xsl:value-of select="concat(',' , title, ',' , url,' ')" /></xsl:for-each></xsl:template> 
</xsl:stylesheet> 

这是转换器

import org.w3c.dom.Document; 
import java.io.File; 
import javax.xml.parsers.DocumentBuilder; 
import javax.xml.parsers.DocumentBuilderFactory; 
import javax.xml.transform.Result; 
import javax.xml.transform.Source; 
import javax.xml.transform.Transformer; 
import javax.xml.transform.TransformerFactory; 
import javax.xml.transform.dom.DOMSource; 
import javax.xml.transform.stream.StreamResult; 
import javax.xml.transform.stream.StreamSource; 

public class XMLToCSV { 
    public static void main(String args[]) throws Exception { 
     File stylesheet = new File("/home/1/style.xsl"); 
     File xmlSource = new File("/home/1/xml.xml"); 

     DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); 
     DocumentBuilder builder = factory.newDocumentBuilder(); 
     Document document = builder.parse(xmlSource); 

     StreamSource stylesource = new StreamSource(stylesheet); 
     Transformer transformer = TransformerFactory.newInstance().newTransformer(stylesource); 
     Source source = new DOMSource(document); 
     Result outputTarget = new StreamResult(new File("/home/1/howto.csv")); 
     transformer.transform(source, outputTarget); 
     System.out.println("Done."); 
    } 
} 

您可以根据需要格式化输出使用这种

这是我的XML看起来像

<?xml version="1.0"?> 
<howto> 
    <topic id="1"> 
     <title>Java</title> 
     <url>http://www.google.com</url> 
    </topic> 
    <topic id="2"> 
     <title>XML</title> 
     <url>http://www.ab</url> 
    </topic> 
    <topic id="3"> 
     <title>Javascript</title> 
     <url>http://www.tt</url> 
    </topic> 
    <topic id="4"> 
     <title>VBScript</title> 
     <url>http://www.wewe</url> 
    </topic> 
</howto> 

希望这有助于...

+0

我也尝试过使用XSLT,但是我遇到的问题是我无法从MDFeedTyps和PxRngRules获取所有数据......等等。你能帮我解释一下如何获得这些数据。 –

+0

请显示您的:精确输出csv如何看起来像对您的数据相当,这将有所帮助。[完成xml数据到csv] –

+1

如果您使用的是撒克逊,然后构建一个DOM树,以便您可以转换它是非常糟糕的做法:转换DOM需要比转换原生的Saxon TinyTree长5-10倍。您应该将来源作为StreamSource或SAXSource提供。 –