试图删除span标签与动感的风格属性
问题描述:
我建立一个小工具,发表网络文章到我们的网站。我们的用户很多时候都直接从Microsoft Word中复制和粘贴到我的wysiwyg编辑器中。编辑器复制所有Word隐藏标签。
我想解决的主要问题是删除<span>
。 Word在<span>
标签后经常会引入很多风格属性。例如:<span style=" Arial, sans-serif; font-size: 10pt; ">
。
有没有办法删除整个span标签?正则表达式?
答
如果你设置使用正则表达式它,你可以尝试像
"/^(<span)+([A-Za-z0-9=,;:])*(>)+$/"
凡(<span)+(>)+
渔获都开始和结束标记和中间部分应该抓住任何属性声明为内联。然后你可以使用php preg_replace用空引号或类似的东西替换这个模式的所有事件。
用DOM解析它。正则表达式不适用于HTML,因为HTML不是常规语言。 – Matt 2012-08-14 14:35:20