利用爬虫代码美女写真套图下载转PDF保存我的世界模组盒子汉化版下载

发布时间：2025-11-04 05:12:09 作者：玩站小弟

爬的利用不是全站链接，该爬虫爬的爬虫我的世界模组盒子汉化版下载是每套图的链接，相当于是代码科技开挂辅助器详情页的链接需要单独下载的python库requestsfake_useragentxpathPIL下面有图片打码是为了过审，这网站真的美女免费科技是正经的写真网站不是什么老司机网站import requests from fake_useragent import UserAgent from lxml import etree import os import aiohttp import asyncio from PIL import Image import shutil #获取详情页全部图片函数 async def get_xq(url): #计数 p=0 tasks = [] res = requests.get(url=url,headers=header) res.encoding="utf-8" res.close() tree = etree.HTML(res.text) #图片标题 imgtitle = tree.xpath(//title/text())[0] global title title = imgtitle #第一页的图片链接 img = tree.xpath(//article//img/@src) imgurl = ["https://www.xgyw01.co" + i for i in img] print("当前下载的套图标题:\n"+imgtitle) for i in imgurl: p += 1 tasks.append(down(i,imgtitle,p)) #获取下一页的链接 next = "https://www.xgyw01.co" + tree.xpath(//div[@class="pagination"][1]//a[last()]/@href)[0] #判断的条件 bool = tree.xpath(//div[@class="pagination"][1]//a[last()]/text())[0] #循环获取所有页 while True: print("正在获取"+next) if bool == "下一页" or bool == "下页": res = requests.get(url=next, headers=header) res.encoding = "utf-8" res.close() tree = etree.HTML(res.text) img = tree.xpath(//article//img/@src) imgurl = ["https://www.xgyw01.co" + i for i in img] for i in imgurl: p += 1 tasks.append(down(i,imgtitle,p)) #判断的条件 bool = tree.xpath(//div[@class="pagination"][1]//a[last()]/text())[0] if bool == "下一页" or bool == "下页": next = "https://www.xgyw01.co" + tree.xpath(//div[@class="pagination"][1]//a[last()]/@href)[0] continue else: break else: break print("开始异步下载图片.....") await asyncio.wait(tasks) #下载函数 async def down(url,filename,fn): filepath = os.path.join(dirdz,filename) if not os.path.exists(filepath): os.mkdir(filepath) async with aiohttp.ClientSession() as session: async with session.get(url) as res: with open(filepath+"/"+str(fn)+".jpg",mode="wb") as f: f.write(await res.content.read()) print(f"第{fn}张下载完成") #写真图片转PDF函数 def jpg_pdf(filename): # 定义文件夹路径和PDF文件名 folder_path = os.path.join(dirdz,filename) pdf_filename = os.path.join(dirdz,filename + ".pdf") # # 将JPEG文件转换为Pillow Image对象并添加到列表中 image_files = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith(.jpeg) or f.endswith(.jpg)] image_list = [] for file_path in image_files: img = Image.open(os.path.abspath(file_path)) image_list.append(img) # 找到所有JPEG文件 image_list[0].save(pdf_filename, "PDF" ,resolution=100.0, save_all=True, append_images=image_list[1:]) print("pdf合并完成,删除缓存的的图片") shutil.rmtree(folder_path) print("清理完成") #主函数 if __name__ == __main__: #定义的公共请求头 header = {"user-agent": UserAgent().random} #定义的保存路径（文件夹路径） dirdz = "这里输入保存的文件夹路径" #定义一个全局的标题保存文件名字 title = "" #爬取的网站是:https://www.xgyw01.co/，找到想下的写真下载网易mc辅助器免费开挂套图直接点进去复制详情页的链接就行了 url = input("请输入套图详情页链接:") #使用异常捕获排除异常 try: #因为是异步函数所以需要用asyncio.run启动 asyncio.run(get_xq(url)) print(title) except: print("链接详情页解析错误.........") print("全部下载完成,开始生成pdf.......") #调用图片转PDF函数 jpg_pdf(title) 。

爬的利用不是全站链接，该爬虫爬的爬虫我的世界模组盒子汉化版下载是每套图的链接，相当于是代码科技开挂辅助器详情页的链接

需要单独下载的python库

requests

fake_useragent

xpath

PIL

下面有图片打码是为了过审，这网站真的美女免费科技是正经的写真网站不是什么老司机网站

import requests from fake_useragent import UserAgent from lxml import etree import os import aiohttp import asyncio from PIL import Image import shutil #获取详情页全部图片函数 async def get_xq(url): #计数 p=0 tasks = [] res = requests.get(url=url,headers=header) res.encoding="utf-8" res.close() tree = etree.HTML(res.text) #图片标题 imgtitle = tree.xpath(//title/text())[0] global title title = imgtitle #第一页的图片链接 img = tree.xpath(//article//img/@src) imgurl = ["https://www.xgyw01.co" + i for i in img] print("当前下载的套图标题:\n"+imgtitle) for i in imgurl: p += 1 tasks.append(down(i,imgtitle,p)) #获取下一页的链接 next = "https://www.xgyw01.co" + tree.xpath(//div[@class="pagination"][1]//a[last()]/@href)[0] #判断的条件 bool = tree.xpath(//div[@class="pagination"][1]//a[last()]/text())[0] #循环获取所有页 while True: print("正在获取"+next) if bool == "下一页" or bool == "下页": res = requests.get(url=next, headers=header) res.encoding = "utf-8" res.close() tree = etree.HTML(res.text) img = tree.xpath(//article//img/@src) imgurl = ["https://www.xgyw01.co" + i for i in img] for i in imgurl: p += 1 tasks.append(down(i,imgtitle,p)) #判断的条件 bool = tree.xpath(//div[@class="pagination"][1]//a[last()]/text())[0] if bool == "下一页" or bool == "下页": next = "https://www.xgyw01.co" + tree.xpath(//div[@class="pagination"][1]//a[last()]/@href)[0] continue else: break else: break print("开始异步下载图片.....") await asyncio.wait(tasks) #下载函数 async def down(url,filename,fn): filepath = os.path.join(dirdz,filename) if not os.path.exists(filepath): os.mkdir(filepath) async with aiohttp.ClientSession() as session: async with session.get(url) as res: with open(filepath+"/"+str(fn)+".jpg",mode="wb") as f: f.write(await res.content.read()) print(f"第{fn}张下载完成") #写真图片转PDF函数 def jpg_pdf(filename): # 定义文件夹路径和PDF文件名 folder_path = os.path.join(dirdz,filename) pdf_filename = os.path.join(dirdz,filename + ".pdf") # # 将JPEG文件转换为Pillow Image对象并添加到列表中 image_files = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith(.jpeg) or f.endswith(.jpg)] image_list = [] for file_path in image_files: img = Image.open(os.path.abspath(file_path)) image_list.append(img) # 找到所有JPEG文件 image_list[0].save(pdf_filename, "PDF" ,resolution=100.0, save_all=True, append_images=image_list[1:]) print("pdf合并完成,删除缓存的的图片") shutil.rmtree(folder_path) print("清理完成") #主函数 if __name__ == __main__: #定义的公共请求头 header = {"user-agent": UserAgent().random} #定义的保存路径（文件夹路径） dirdz = "这里输入保存的文件夹路径" #定义一个全局的标题保存文件名字 title = "" #爬取的网站是:https://www.xgyw01.co/ ，找到想下的写真下载网易mc辅助器免费开挂套图直接点进去复制详情页的链接就行了 url = input("请输入套图详情页链接:") #使用异常捕获排除异常 try: #因为是异步函数所以需要用asyncio.run启动 asyncio.run(get_xq(url)) print(title) except: print("链接详情页解析错误.........") print("全部下载完成,开始生成pdf.......") #调用图片转PDF函数 jpg_pdf(title)

Tag： mc我的世界手机版下载我的世界直装版我的世界模组直装版下载我的世界科技服务器 mc黑科技大全教程我的世界科技mod 网易mc挂免费挂科技 RunAway我的世界科技下载我的世界科技空岛整合包下载我的世界科技mod

2023最新去水印小程序源码分享，无需后台，对接接口
源码简介2023最新去水印小程序源码分享，无需后台，对接接口。站长测试了下，发现解析接口是收费的。自己有免费接口的可以自己替换下。UI看着挺不错的。下载地址此处内容需要回复后才能查看
2025-11-04
大木AI
大木AI是一款拥有大量ai角色的智能聊天对话软件，都市，动作，科幻以及穿越等题材都应有尽有，用户可以根据自己的兴趣自己选择参与，与不同的角色在线对话，可以秒回你的消息，跌宕起伏的剧情也让人沉浸其中，有
2025-11-04
海豚浏览器无国界全球通
海豚浏览器无国界全球通是一款功能实用的浏览器软件，可以在线搜索各种信息，也可以自定义界面，给你独一无二的使用体验，并且还支持用户使用手势来进行操控，也拥有各种主题可以选择，在你使用过程中可以保护你的隐
2025-11-04
喜弟cd社交
喜弟cd社交是一款为年轻化人群打造的社交聊天类软件，在这款软件中，你可以尽情的享受一个充满乐趣和创意的社交生活，在软件中你可以寻找那些和你聊得来的人进行结交。喜弟cd社交内设置了许多新颖的聊天模式和聊
2025-11-04
非常漂亮的自适应个人主页卡片导航 HTML源码
源码介绍非常漂亮的自适应个人主页卡片导航 HTML源码，用的导航网站是非常重要的。现在，我将为大家分享一个自适应、耐看且有详细注释的个人主页网址导航 HTML 源码。通过该 HTML 代码示例，我们可
2025-11-04
小米天气通用版
小米天气通用版是一款能够为用户提供15日以内的天气预报服务的生活小助手app，软件中将能够为用户提供各种不同地区的天气预报，更有天气变化的及时消息等你来查看，小米天气通用版帮助用户能够更好作出准备，为
2025-11-04