从HTML解析JSON
问题描述:
使用NodeJS我想解析声明的JSON和JS变量,这是第三方网站的HTML。从HTML提取JSON变量并输出它的最简单方法是什么?从HTML解析JSON
HTML大块从中我想提取提到JS可以波纹管可以看出:
...
<footer>
<div>
<script type="application/ld+json">
{"@context":"http:\/\/schema.org","@type":"BreadcrumbList","itemListElement":[{"@type":"ListItem","position":1,"item":{"@id":"https:\/\/www.domain.com\/","image":"https:\/\/assets.domain.com\/img\/facebook\/stuf.png","name":"Home"}}]}
</script>
<script>
var API_URL = ["https:\/\/api1.domain.com\/api","https:\/\/api2.domain.com\/api","https:\/\/api3.domain.com\/api"],
</script>
</div>
</footer>
...
以下HTML是从XY网站使用要求的NodeJS解析。
我试着用JSDOM,但我不知道如何选择提到的<script>
。正则表达式是唯一的解决方案?
答
如果您提供,选择器将是:footer>div>script:nth-child(2)
。 这是你要求的吗?
+0
我想我可以在星期五责怪它,甚至没有考虑脚本是DOM ... ty的一部分 – Sigismund
这是绝对不清楚你在问什么。请提供一些最低限度的例子。 – Lazyexpert
我希望这有助于。 – Sigismund