категории | RSS

Наверняка некоторые хабралюди читают книги на сайте https://lib.aldebaran.ru. Они знают о том, что с некоторых пор текст на сайте "защищён" от копирования. Конечно, большая часть книг осталась доступна для скачивания в удобных для чтения форматах, но многие популярные книги можно только читать он-лайн. Что неудобно.
Следующий несложный скрипт на Питоне скачает книгу целиком, попутно вырезав весь мусор напиханый туда для затруднения копирования. (В прикреплённом файле)
import urllib, re, sys
p_key = re.compile('http:\/\/lib\.aldebaran\.ru\/getpage\/1\/.*?"')
p_span = re.compile('(.*?)')
p_s = re.compile('\';s \ = \'')
p_p = re.compile('(.*?)')
p_url_name = re.compile('^(http:\/\/lib.aldebaran.ru\/author\/.*?__)')
def getpage(url):
try:
key = p_key.findall(urllib.urlopen(url).read())[0][-33:-1]
except:
return None
urllib.urlopen("https://lib.aldebaran.ru/getpage/1/" key) .read()
page = urllib.urlopen("https://lib.aldebaran.ru/getpage/2/" key) .read()
page = p_span.sub('', page)
page = ''.join(p_p.findall(page))
page = p_s.sub('', page)
return page

url = sys.argv[1]
url = p_url_name.findall(url)[0]
i = 1
while True:
page = getpage(url str(i) '.html')
i = 1
if page != None:
print page
else:
sys.exit(0)
Скрипт принимает параметром командной строки ссылку на любую страницу книги и выводит её текст на стандартный вывод.
Пользоватся им очень просто:
python lit.py https://lib.aldebaran.ru/author/sadov_sergei/sadov_sergei_klinki_u_trona/sadov_sergei_klinki_u_trona__0.html > lit.html

Для ленивых есть прога которая делает практически тоже самое eBookDownloader

Прикрепленный файл: 1643_script.zip ( меньше 1кб)

controller_atc
2008-03-08T01:01:42Z
Здесь находятся
всего 0. За сутки здесь было 0 человек

Комментарии 9

#9   bogdan-g    

га га га, 404, упали файлы?


0 ответить

#9   canbl4    

Я на смарте для того, чтобы сделать книгу из версии онлайн через Ucweb сохраняю ее в txt файл и затем через Dedit редактирую сохраненную станицу и сохраняю в нужной кодировке.Если станиц несколько, то потом можно их собрать через копи-паст в том же Dedit или использовать программы для склейки файлов.


0 ответить

#9   Diak-74    

На смарт край надо!Я заядлый читатель, а компа нет и вряд-ли скоро будет.


0 ответить

#9   atrant    

да, статья реально скорее показать питонщикам про новый нужный проект =) а, кстати, я и не знал о нововведениях то. На компе смотрю на них шустро отреагировали =))


0 ответить

#9   controller_atc    

Просите питонщиков они смогут, тогда тысячам смартфонщикам счастье подвалитsmile


0 ответить

#9   _ALBERT_    

Кто первый для смарта напишет?=)


0 ответить

#9   Pachon    

А нельзя написать такой же скрипт для смарта?


0 ответить

#9   controller_atc    

Спасибо Роме ака Rpg87 за инфу, морально-меркантильно-этические планы этого действа думаю обсуждать не стоит достаточно зайти на либрусек и почитать переписку Ларина с небезызвесным Магистром, сразу станет ясно как зарабатывают денешку наши доморощеные комерсанты букинисты, кому надо купит понравившееся на бумаге, я так и делаю.


0 ответить

Яндекс.Метрика