我使用Argotic Syndication Framework来解析一个rss-feed到feed项目中的c#strip rss描述为使用Argotic整合框架的html

问题描述:

我正在使用Argotic Syndication Framework解析一个rss-feed到feed项目。不过,我需要去除所有html的描述。我使用<code>Argotic Syndication Framework</code>来解析一个rss-feed到feed项目中的c#strip rss描述为使用Argotic整合框架的html

下面显示了rss提要描述的示例。

Jeg blev i maj inviteret til at holde et oplæg som keynote speaker på en konference i Alaska i HETL-regi (The International Higher Education Teaching and Learning Association). Patrick Blessinger, stifteren af HETL, har netop medvirket i et amerikansk online radio &#8230; <a href="http://aesbrock.wordpress.com/2013/07/12/niels-brock-naevnt-i-amerikansk-radio-interview/">Læs resten <span class="meta-nav">&#8594;</span></a><img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=aesbrock.wordpress.com&#038;blog=978571&#038;post=4538&#038;subd=aesbrock&#038;ref=&#038;feed=1" width="1" height="1" /> 

我希望它只是显示为不带html的文本。

我试着用下面的正则表达式

Regex.Replace(item.Description, @"<(.|\n)*?>", string.Empty); 

但是这是不完全正确;

我看到了关于使用HTMLAgilityPack的建议,但我想避免使用外部库。

任何建议,非常感谢。

+0

这个怎么样:'Regex.Replace(item.Description,“<.>”,string.Empty);' – Pete

感谢Pete的建议,但它仍然留下了一些html。我结束了这样做。

HttpUtility.HtmlDecode(Regex.Replace(item.Description, @"<!--[\S\s]*?-->|<(?:"".*?""|'.*?'|[\S\s])*?>", "")); 

其从后(在webz地方),但我没有书签,所以如果有人认识到它 - 谢谢:)我希望它可以帮助别人。