记事本++:如何删除除url之外的所有内容?
问题描述:
我有一个文本文档,其中有很多网址。 URls有许多不同的结局,如.net,.com,.de等...所有的URL都没有http:// oder www。前面。还有就是文档中许多其他的文本,它看起来是这样的:记事本++:如何删除除url之外的所有内容?
2014/05/03 Red V!per M R United States jsugarcia.com/viper.gif Linux mirror
2014/05/03 Red V!per M R United States thepeoplecenter.org/viper.gif Linux mirror
2014/05/03 Red V!per R Netherlands ghijbeek.nl/viper.gif Linux mirror
2014/05/03 Red V!per M R Netherlands straalbedrijfsanders.nl/viper.gif Linux mirror
2014/05/03 Red V!per R European Union serialnastya.com/viper.gif Linux mirror
2014/05/03 Red V!per M R Denmark thueringer-treppenlifte.de/vip... Linux mirror
2014/05/03 Red V!per R United States tapitwater.com/images/viper.gif Linux mirror
2014/05/03 Red V!per R Norway sekureco.no/viper.gif Linux mirror
我想在记事本中筛选++现在让我只有用这样的linebrak网址:
网站。 COM
答
似乎所有行终止Linux mirror
,如果它是永诺的情况下,你可以这样做:
- 按Ctrl + ^h
- 查找内容:
^.+\s+([^\s/]+)\S+\s+Linux\s+mirror
- 替换为:
$1
- 全部替换
说明:
^ : begining of line
.+ : 1 or more any character
\s+ : 1 or more space
( : start group 1
[^\s/]+ : 1 or more NON space or NON slash (The domain)
) : end group 1
\S+ : 1 or more NON space
\s+ : 1 or more space
Linux : literally Linux
\s+ : 1 or more space
mirror : literally mirror
结果为给定的例子:
jsugarcia.com
thepeoplecenter.org
ghijbeek.nl
straalbedrijfsanders.nl
serialnastya.com
thueringer-treppenlifte.de
tapitwater.com
sekureco.no
+0
令人惊叹,非常感谢! –
答
- 按
Ctrl+F
打开搜索框 - 选择选项
Regular Expression
- 将这个正则表达式在查找内容框中:
.*(\b\w+\.com).*
- 按下按钮
Find All in Current Document
您可以测试正则表达式,你想在:https://regex101.com/r/0o2IsM/3
+0
非常感谢你的帮助
什么'均值与像this'一个linebrak? – user