如何从python的文本文件中获取基本url?
问题描述:
我有有详细的路径多个网址我想用正则表达式如何从python的文本文件中获取基本url?
文本文件,以获得唯一的基本URL包含这样
www.facbook.com/abc/xyz
www.google.com.pk/q=12hsjak
www.yahoo.co.uk/avga/ajak
defence.pk/zya/bahawalpur
Pic2fly.uk/abc
网址,希望有一个文本文件,这样
Www.facebook.com
Www.google.com.pk
Www.yahoo.co.uk
Defence.pk
Pic2fly.uk
输出
请帮忙
我试过这个
Print re.search(r'(https?://)?(www\.)?([^/]*)', url)[3]
答
我会保持所有的URL与(“/”)内,到一个列表,然后将搜索列表如下:
list1=['www.facbook.com/abc/xyz','www.google.com.pk/q=12hsjak','www.yahoo.co.uk/avga/ajak','defence.pk/zya/bahawalpur','Pic2fly.uk/abc']
i=0
while i<len(list1):
print(list1[i][:list1[i].find('/')])
i+=1
结果是你想要的,就像这样:
www.facbook.com
www.google.com.pk
www.yahoo.co.uk
defence.pk
Pic2fly.uk
你试过了什么吗?什么不行? – Toto
是的,我在问题中加入了 – user7442628