跳至主要內容
wenku8小说收集

我是个收集党,对东西有很强的占有欲,想把喜欢的东西保存下来。

《魔女之旅》是一部我很喜欢的番剧,因为番剧,我知道了这是一系列丛书,因此我想把它从wenku网站给转移到我的GitHub上观看。

初步构想是以markdown语法写入GitHub,这样就可以直接看了。

那么,需要分为网页请求,获取所有的分目录以及所对应的网址,在对这些网址的信息,即小说的具体内容读出。

写着写着就不止于把《魔女之旅》下下来,这个文库网站说了停站,但还是有不少的小说在网站上可以通过url访问到,大概有1000套小说左右,分布在**https://www.wenku8.net/novel/2/(2000~3000)/index.htm**,所以我就顺手哦把这整个网站的所有小说下载然后写成md文件传到GitHub上,作为一个小说库,这是我搭建电子图书馆的第一个项目。


Jelly大约 1 分钟PythonPython爬虫
漫画狗漫画下载

manga-get

我在了解galgame中接触到了一些漫画, 这些漫画大概率是不可能被做成番剧那样的视频的, 我就想找一些漫画网站看漫画, 但是有的网站弹窗太多, 页面不整洁, 加载太慢等诸多问题, 我就想直接把漫画下载到本地来看, 顺便巩固下最近学的知识。

首先我着手对dogemanga(漫画狗)这个漫画网站进行分析, 从url来看主要分为三类页面:

  1. com/?=搜索内容/
  2. com/m/
  3. com/p/

所以可以通过解析url来确定所在的页面。

上述三个页面中内容的关系为:1-匹配结果(可能与搜索有关的漫画有关的漫画)>2-漫画所包含的(话/卷)>3-(话/卷)所含的每一页。


Jelly大约 2 分钟PythonPython爬虫