记事本++:如何删除除url之外的所有内容?

记事本++:如何删除除url之外的所有内容?

问题描述:

我有一个文本文档,其中有很多网址。 URls有许多不同的结局,如.net,.com,.de等...所有的URL都没有http:// oder www。前面。还有就是文档中许多其他的文本,它看起来是这样的:记事本++:如何删除除url之外的所有内容?

2014/05/03 Red V!per  M R United States  jsugarcia.com/viper.gif Linux mirror 
2014/05/03 Red V!per  M R United States  thepeoplecenter.org/viper.gif Linux mirror 
2014/05/03 Red V!per   R Netherlands  ghijbeek.nl/viper.gif Linux mirror 
2014/05/03 Red V!per  M R Netherlands  straalbedrijfsanders.nl/viper.gif Linux mirror 
2014/05/03 Red V!per   R European Union  serialnastya.com/viper.gif Linux mirror 
2014/05/03 Red V!per  M R Denmark  thueringer-treppenlifte.de/vip... Linux mirror 
2014/05/03 Red V!per   R United States  tapitwater.com/images/viper.gif Linux mirror 
2014/05/03 Red V!per   R Norway  sekureco.no/viper.gif Linux mirror 

我想在记事本中筛选++现在让我只有用这样的linebrak网址:

网站。 COM

+0

什么'均值与像this'一个linebrak? – user

似乎所有行终止Linux mirror,如果它是永诺的情况下,你可以这样做:

  • 按Ctrl + ^h
  • 查找内容:^.+\s+([^\s/]+)\S+\s+Linux\s+mirror
  • 替换为:$1
  • 全部替换

说明:

^   : begining of line 
    .+  : 1 or more any character 
    \s+  : 1 or more space 
    (  : start group 1 
    [^\s/]+ : 1 or more NON space or NON slash (The domain) 
)   : end group 1 
    \S+  : 1 or more NON space 
    \s+  : 1 or more space 
    Linux  : literally Linux 
    \s+  : 1 or more space 
    mirror : literally mirror 

结果为给定的例子:

jsugarcia.com 
thepeoplecenter.org 
ghijbeek.nl 
straalbedrijfsanders.nl 
serialnastya.com 
thueringer-treppenlifte.de 
tapitwater.com 
sekureco.no 
+0

令人惊叹,非常感谢! –

  1. Ctrl+F打开搜索框
  2. 选择选项Regular Expression
  3. 将这个正则表达式在查找内容框中:.*(\b\w+\.com).*
  4. 按下按钮Find All in Current Document

您可以测试正则表达式,你想在:https://regex101.com/r/0o2IsM/3


enter image description here

enter image description here

+0

非常感谢你的帮助