我使用Argotic Syndication Framework
来解析一个rss-feed到feed项目中的c#strip rss描述为使用Argotic整合框架的html
问题描述:
我正在使用Argotic Syndication Framework
解析一个rss-feed到feed项目。不过,我需要去除所有html的描述。我使用<code>Argotic Syndication Framework</code>来解析一个rss-feed到feed项目中的c#strip rss描述为使用Argotic整合框架的html
下面显示了rss提要描述的示例。
Jeg blev i maj inviteret til at holde et oplæg som keynote speaker på en konference i Alaska i HETL-regi (The International Higher Education Teaching and Learning Association). Patrick Blessinger, stifteren af HETL, har netop medvirket i et amerikansk online radio … <a href="http://aesbrock.wordpress.com/2013/07/12/niels-brock-naevnt-i-amerikansk-radio-interview/">Læs resten <span class="meta-nav">→</span></a><img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=aesbrock.wordpress.com&blog=978571&post=4538&subd=aesbrock&ref=&feed=1" width="1" height="1" />
我希望它只是显示为不带html的文本。
我试着用下面的正则表达式
Regex.Replace(item.Description, @"<(.|\n)*?>", string.Empty);
但是这是不完全正确;
我看到了关于使用HTMLAgilityPack
的建议,但我想避免使用外部库。
任何建议,非常感谢。
答
感谢Pete的建议,但它仍然留下了一些html。我结束了这样做。
HttpUtility.HtmlDecode(Regex.Replace(item.Description, @"<!--[\S\s]*?-->|<(?:"".*?""|'.*?'|[\S\s])*?>", ""));
其从后(在webz地方),但我没有书签,所以如果有人认识到它 - 谢谢:)我希望它可以帮助别人。
这个怎么样:'Regex.Replace(item.Description,“<.>”,string.Empty);' – Pete