如何从python的文本文件中获取基本url?

问题描述:

我有有详细的路径多个网址我想用正则表达式如何从python的文本文件中获取基本url?

文本文件,以获得唯一的基本URL包含这样

www.facbook.com/abc/xyz 
www.google.com.pk/q=12hsjak 
www.yahoo.co.uk/avga/ajak 
defence.pk/zya/bahawalpur 
Pic2fly.uk/abc 

网址,希望有一个文本文件,这样

Www.facebook.com 
Www.google.com.pk 
Www.yahoo.co.uk 
Defence.pk 
Pic2fly.uk 
输出

请帮忙

我试过这个

Print re.search(r'(https?://)?(www\.)?([^/]*)', url)[3] 
+0

你试过了什么吗?什么不行? – Toto

+0

是的,我在问题中加入了 – user7442628

您不需要为此尝试os.path.spliturlparse

+0

不要使用'os.path.split'。即使它适用于某些/大部分/所有操作系统,这也是该作业的错误工具。 –

我会保持所有的URL与(“/”)内,到一个列表,然后将搜索列表如下:

list1=['www.facbook.com/abc/xyz','www.google.com.pk/q=12hsjak','www.yahoo.co.uk/avga/ajak','defence.pk/zya/bahawalpur','Pic2fly.uk/abc'] 
i=0 
while i<len(list1): 
    print(list1[i][:list1[i].find('/')]) 
    i+=1 

结果是你想要的,就像这样:

www.facbook.com 
www.google.com.pk 
www.yahoo.co.uk 
defence.pk 
Pic2fly.uk