如何从XML recurssively属性读取数据并将其存储在CSV在Java中
我有XML数据,如下所示,如何从XML recurssively属性读取数据并将其存储在CSV在Java中
<?xml version="1.0" encoding="ISO-8859-1"?>
<FIXML xsi:schemaLocation="http://www.fixprotocol.org/FIXML-5-0-SP2 fixml-main-5-0-SP2_.xsd" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" s="2012-04-23" v="FIX.5.0SP2">
<Batch ID="RPTTA111PUBLI20170509">
<MktDef MktID="XEUR" MktSegID="14" EfctvBizDt="2017-05-11" NxtEfctvBizDt="2017-05-15" MktSeg="CONF" MarketSegmentDesc="FUT 8-13 Y. SWISS GOV.BONDS 6%" Sym="CH0002741988" ParentMktSegmID="FBND" Ccy="CHF" MktSegStat="1" USFirmFlag="Y" PartID="2">
<MtchRules MtchRuleProdCmplx="5" MtchAlgo="PT" />
<MtchRules MtchRuleProdCmplx="1" MtchAlgo="PT" />
<FlexProdEligs FlexProdEligCmplx="5" FlexProdElig="Y" />
<BaseTrdgRules QtSideInd="1" FastMktPctg="0">
<TickRules TickRuleProdCmplx="1" StartTickPxRng="0" EndTickPxRng="99999.9999" TickIncr="0.01" />
<TickRules TickRuleProdCmplx="5" StartTickPxRng="0" EndTickPxRng="99999.9999" TickIncr="0.01" />
<QuotSizeRules MinBidSz="1" MinOfrSz="1" FastMktInd="0" />
<QuotSizeRules MinBidSz="1" MinOfrSz="1" FastMktInd="1" />
<PxRngRules PxRngRuleID="75" PxRngProdCmplx="1" StartPxRng="0" EndPxRng="99999.9999" PxRngValu="0.15" />
<PxRngRules PxRngRuleID="347" PxRngProdCmplx="5" StartPxRng="0" EndPxRng="99999.9999" PxRngValu="0.12" />
</BaseTrdgRules>
<MDFeedTyps MDFeedTyp="HS" MDBkTyp="2" MktDepth="10" MDRcvryTmIntvl="120000" SvcLctnID1="224.0.50.102" SvcLctnSubID1="59500" SvcLctnID2="224.0.50.230" SvcLctnSubID2="59500" />
<MDFeedTyps MDFeedTyp="HI" MDBkTyp="2" MktDepth="10" MktDepthTmIntvl="0" SvcLctnID1="224.0.50.103" SvcLctnSubID1="59501" SvcLctnID2="224.0.50.231" SvcLctnSubID2="59501" />
<MDFeedTyps MDFeedTyp="HI" MDBkTyp="3" MktDepthTmIntvl="0" SvcLctnID1="224.0.114.97" SvcLctnSubID1="59501" SvcLctnID2="224.0.114.113" SvcLctnSubID2="59501" />
<MDFeedTyps MDFeedTyp="HS" MDBkTyp="3" SvcLctnID1="224.0.114.96" SvcLctnSubID1="59500" SvcLctnID2="224.0.114.112" SvcLctnSubID2="59500" />
<MDFeedTyps MDFeedTyp="L" MDBkTyp="2" MktDepth="5" MktDepthTmIntvl="3500" MDRcvryTmIntvl="30000" SvcLctnID1="224.0.50.89" SvcLctnSubID1="59500" SvcLctnID2="224.0.50.217" SvcLctnSubID2="59500" />
</MktDef>
<SecDef PriSetPx="158.39">
<Instrmt ID="408805" Src="M" SecTyp="FUT" Status="1" ProdCmplx="1" CFI="FFMPSX" MatDt="2017-06-08" MMY="201706" Mult="1" ValMeth="FUT" SettlMeth="P" SettlSubMeth="4" PxPrcsn="2" MinPxIncr="0.01" MinPxIncrAmt="10">
<AID AltID="1048612" AltIDSrc="M" />
<AID AltID="XF000001RQD8" AltIDSrc="4" />
<Evnt EventTyp="7" Dt="2017-06-08" />
</Instrmt>
<MktSegGrp MktSegID="14">
<SecTrdgRules>
<BaseTrdgRules>
<PxRngRules PxRngRuleID="75" />
</BaseTrdgRules>
</SecTrdgRules>
</MktSegGrp>
</SecDef>
</Batch>
</FIXML>
我想从这个XML读取数据并将其存储在CSV文件下面。
列名应该是RootElementName_ChildElementName(如果有)_AttributeName。这种格式我应该遵循,
假设RootElement是FIXML,并且我们有属性“s”和“v”,所以列名应该如下FIXML_s,FIXML_v。
而且子元素批处理和MktDef列名应该是 FIXML_Batch_ID和FIXML_Batch_MktDef_MktID就像下面那样。
1) FIXML_s FIXML_v FIXML_Batch_ID FIXML_Batch_MktDef_MktID . . . . .
"2012-04-23" "FIX.5.0SP2" RPTTA111PUBLI20170509 XEUR ....
.
.
.
我们有这样的数据,成千上万行的,当它到达的"</SecDef>"
数据应在2号线和喜欢它继续第3行打印。
有人可以指导我这个。在处理XML数据方面我很新。
你可以把这个作为样本 其中
你必须desgn自己 style.xsl
听到是我的
<?xml version="1.0"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:fo="http://www.w3.org/1999/XSL/Format">
<xsl:output method="text" omit-xml-declaration="yes" indent="no" />
<xsl:template match="/">
topic,title,url
<xsl:for-each select="//topic"><xsl:value-of select="@id" /><xsl:value-of select="concat(',' , title, ',' , url,' ')" /></xsl:for-each></xsl:template>
</xsl:stylesheet>
这是转换器
import org.w3c.dom.Document;
import java.io.File;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Result;
import javax.xml.transform.Source;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import javax.xml.transform.stream.StreamSource;
public class XMLToCSV {
public static void main(String args[]) throws Exception {
File stylesheet = new File("/home/1/style.xsl");
File xmlSource = new File("/home/1/xml.xml");
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(xmlSource);
StreamSource stylesource = new StreamSource(stylesheet);
Transformer transformer = TransformerFactory.newInstance().newTransformer(stylesource);
Source source = new DOMSource(document);
Result outputTarget = new StreamResult(new File("/home/1/howto.csv"));
transformer.transform(source, outputTarget);
System.out.println("Done.");
}
}
您可以根据需要格式化输出使用这种
这是我的XML看起来像
<?xml version="1.0"?>
<howto>
<topic id="1">
<title>Java</title>
<url>http://www.google.com</url>
</topic>
<topic id="2">
<title>XML</title>
<url>http://www.ab</url>
</topic>
<topic id="3">
<title>Javascript</title>
<url>http://www.tt</url>
</topic>
<topic id="4">
<title>VBScript</title>
<url>http://www.wewe</url>
</topic>
</howto>
希望这有助于...
我也尝试过使用XSLT,但是我遇到的问题是我无法从MDFeedTyps和PxRngRules获取所有数据......等等。你能帮我解释一下如何获得这些数据。 –
请显示您的:精确输出csv如何看起来像对您的数据相当,这将有所帮助。[完成xml数据到csv] –
如果您使用的是撒克逊,然后构建一个DOM树,以便您可以转换它是非常糟糕的做法:转换DOM需要比转换原生的Saxon TinyTree长5-10倍。您应该将来源作为StreamSource或SAXSource提供。 –
那么是什么决定哪些属性形成结果的单行? –
对于SecDef我们有PriSetPx,对于MktDef我们有MktSegID。基于这两个属性,我们将决定每次迭代的结果。 –
请考虑简化您的XML代码片段,然后展示并解释您希望使用XSLT创建的完整对应CSV,并解释哪些元素及其属性映射到CSV中的一行。所有那些具有相同属性的'MDFeedTyps'应该会发生什么,它们都属于同一行还是属于不同行? –