在ruby中的纯HTML中的位置查找值按照我的Html文件没有任何类的文件
问题描述:
。我试图得到没有。从纯HTML在ruby中的纯HTML中的位置查找值按照我的Html文件没有任何类的文件
<html>
<head></head>
<body>
PO Number : [4587958]
</body>
</html>
我能够通过使用
require 'rubygems'
require 'nokogiri'
PAGE_URL = "a.html"
page = Nokogiri::HTML(open(PAGE_URL))
data = page.css("body").text
puts data
test = data
ponumber = test.scan('PO Number')
puts ponumber
找出订单号测试我不能得到否定的。
答
您可以通过与匹配数字的正则表达式scaning得到数:
page.css('body').text.scan(/\d+/)
# ["4587958"]
page.css('body').text.scan(/\d+/).first.to_i
# 4587958
scan
将返回所有匹配的数组。如果你的文档中有多个数字,只需选择你想要选择的元素:
# Example:
# Invoice Number : [78945824] PO Number : [4587958]
page.css('body').text.scan(/\d+/)
# ["78945824", "4587958"]
page.css('body').text.scan(/\d+/)[1].to_i
# 4587958
谢谢spickermann ..它的工作..只是想知道我是否想要检索第二个值。像发票号码:[78945824]采购订单编号:[4587958] – SWagh
@SWagh:查看我的更新回答 – spickermann
谢谢:) @spickermann – SWagh