在ruby中的纯HTML中的位置查找值按照我的Html文件没有任何类的文件

问题描述:

。我试图得到没有。从纯HTML在ruby中的纯HTML中的位置查找值按照我的Html文件没有任何类的文件

<html> 
<head></head> 
    <body> 
    PO Number : [4587958] 
    </body> 
</html> 

我能够通过使用

require 'rubygems' 

require 'nokogiri' 

PAGE_URL = "a.html" 

page = Nokogiri::HTML(open(PAGE_URL)) 

data = page.css("body").text 
puts data 
test = data 
ponumber = test.scan('PO Number') 
puts ponumber 

找出订单号测试我不能得到否定的。

您可以通过与匹配数字的正则表达式scaning得到数:

page.css('body').text.scan(/\d+/) 
# ["4587958"] 

page.css('body').text.scan(/\d+/).first.to_i 
# 4587958 

scan将返回所有匹配的数组。如果你的文档中有多个数字,只需选择你想要选择的元素:

# Example: 
# Invoice Number : [78945824] PO Number : [4587958] 

page.css('body').text.scan(/\d+/) 
# ["78945824", "4587958"] 

page.css('body').text.scan(/\d+/)[1].to_i 
# 4587958 
+0

谢谢spickermann ..它的工作..只是想知道我是否想要检索第二个值。像发票号码:[78945824]采购订单编号:[4587958] – SWagh

+0

@SWagh:查看我的更新回答 – spickermann

+0

谢谢:) @spickermann – SWagh