#простой Python-скрипт, который извлекает веб-страницу, парсит ее на наличие URL-ссылок и выводит на экран первые 10 из них.
import re
import urllib
regex = re.compile(r'href="([^"]+)"')
def matcher(url, max=10):
data = urllib.urlopen(url).read()
hits = regex.findall(data)
for hit in hits[:max]:
print urllib.basejoin(url, hit)
matcher("https://dimonvideo.ru")
Прикрепленный файл #1: 762_url_parser.zip | скачать с зеркала | (455 b)
ответ опубликован:
Рейтинг: 5
голосов: 2
- 5
- 1
- 2
- 3
- 4
- 5

