摘要: 为了入门scrapy框架,昨天写了一个爬取静态小说网站的小777真钱老虎机 下面我们尝试爬取全书网中网游动漫类小说的书籍信息。 一、准备阶段 明确一下爬虫页面分析的思路: 对于书籍列表页:我们需要知道打开单本书籍的地址、以及获取点开下一页书籍列表页的链接 对于书籍信息页面,我们需要找到提取:(书名、作者、书本简阅读全文
posted @ 2019-04-22 09:02 原生树袋虾 阅读(272) 评论(0) 编辑
摘要: Pexel上有大量精美的图片,没事总想看看有什么好看的自己保存到电脑里可能会很有用 但是一个一个保存当然太麻烦了 所以不如我们写个爬虫吧(๑•̀ㅂ•́)و✧ 一开始学习爬虫的时候希望爬取pexel上的壁纸,然而自己当时不会 上周好不容易搞出来了,周末现在认真地总结一下上周所学的内容 也希望自己写的东阅读全文
posted @ 2019-04-20 17:22 原生树袋虾 阅读(196) 评论(0) 编辑
摘要: Before 在实现一个例子之前,首先要明确自己想要获得怎样的结果:爬取近六年出版评分在7分以上的漫画 最后我想要得到的信息是所有满足要求的书名 要求有二:1、近六年出版,即出版时间 >= 2013年 2、评分在7分以上 接下来针对我们的要求,去观察页面元素 我们观察一下页面(https://boo阅读全文
posted @ 2019-04-13 17:29 原生树袋虾 阅读(181) 评论(0) 编辑
摘要: 应老师分的方向,昨天开始自学入门爬虫了 虽然实现了一个比较简单的小爬虫,自己还是非常兴奋的,还是第一次实现 真的好开心 本来想爬pexel上的壁纸,然而发现对方的网页不知道设置了什么,反正有反爬虫手机老虎机游戏下载,用python访问直接Fobbiden!真小气qwq 最后还是乖乖去爬zol上的壁纸了 Befor阅读全文
posted @ 2019-04-10 09:57 原生树袋虾 阅读(824) 评论(2) 编辑
摘要: 一波三折,终于调剂成功 获得一个在中科院学习的机会了 太不容易了,要好好珍惜T-T阅读全文
posted @ 2019-04-08 08:55 原生树袋虾 阅读(18) 评论(2) 编辑
摘要: 再战华科,英语58不知道是考砸了还是咋的 总之无缘华科 无缘复试 调剂也去不了什么好地方 怎么说呢 错一点到最后可能就错很多很多 人生就是如此 你永远不知道现在的结果是前面无数多少细微的差错导致的 但是我也不能止步不前 向前进就会看到希望,好好努力吧 人生才刚开始呢 要勇往直前 毕竟是自己喜欢的学科阅读全文
posted @ 2019-03-22 17:54 原生树袋虾 阅读(24) 评论(0) 编辑
摘要: 暴力遍历:对于1~n以内的每一数i 每一个i只需要考虑2~i开根号以内是否有可以让i整除的数,即(i%x==0)只要满足就不是素数 否则输出阅读全文
posted @ 2019-03-20 22:55 原生树袋虾 阅读(219) 评论(0) 编辑
摘要: 暴力法: 遍历字符串,挨个字符往后对比,但凡出现相同的则把后面的字符串往前挪 记得末位补位结束符'\0'阅读全文
posted @ 2019-03-20 22:28 原生树袋虾 阅读(8) 评论(0) 编辑
摘要: exp 输入D 输出 A B C D C B A A B C B A A B A A 思路很简单的一个字符输入问题 把字母套到一个数组里,通过计算输入字符在字母表中的位置按照顺序输入数据即可 大小写字母分开讨论(原题有小写字母,这里只写了大写字母,但是逻辑是一样的,不赘述) 代码实现:阅读全文
posted @ 2019-02-22 23:35 原生树袋虾 阅读(10) 评论(0) 编辑
摘要: hust上机题 题目描述: 输入一个仅含有十二进制数字的字符串(字母一律小写,不超过八个字符) 完成以下任务 1、输出该十二进制数每一位对应的十进制数(从高位到低位顺序输出,空格隔开); 2、实现十二进制转十进制的算法,输出该是二进制数对应的十进制数 3、输出转换后的十进制数在内存中的每个二进制位。阅读全文
posted @ 2019-02-21 22:16 原生树袋虾 阅读(6) 评论(0) 编辑
博聚网