如何从python的文本文件中获取基本url？

问题描述：

我有有详细的路径多个网址我想用正则表达式如何从python的文本文件中获取基本url？

文本文件，以获得唯一的基本URL包含这样

www.facbook.com/abc/xyz 
www.google.com.pk/q=12hsjak 
www.yahoo.co.uk/avga/ajak 
defence.pk/zya/bahawalpur 
Pic2fly.uk/abc

网址，希望有一个文本文件，这样

Www.facebook.com 
Www.google.com.pk 
Www.yahoo.co.uk 
Defence.pk 
Pic2fly.uk

输出

请帮忙

我试过这个

Print re.search(r'(https?://)?(www\.)?([^/]*)', url)[3]

你试过了什么吗？什么不行？ – Toto

是的，我在问题中加入了 – user7442628

答

您不需要为此尝试os.path.split或urlparse。

不要使用'os.path.split'。即使它适用于某些/大部分/所有操作系统，这也是该作业的错误工具。 –

答

我会保持所有的URL与（“/”）内，到一个列表，然后将搜索列表如下：

list1=['www.facbook.com/abc/xyz','www.google.com.pk/q=12hsjak','www.yahoo.co.uk/avga/ajak','defence.pk/zya/bahawalpur','Pic2fly.uk/abc'] 
i=0 
while i<len(list1): 
    print(list1[i][:list1[i].find('/')]) 
    i+=1

结果是你想要的，就像这样：

www.facbook.com 
www.google.com.pk 
www.yahoo.co.uk 
defence.pk 
Pic2fly.uk

如何从python的文本文件中获取基本url？

相关推荐