python如何写一个zblog采集程序(启明seo) | 沐白SEO博客

2024-06-24 00:44:43

最近写了一段代码，实现了采集文章后自动上传到博客的脚步，之前也想过要搞一个，当时思路是通过数据库，将采集的内容更新到数据库里。当然，这样是可以实现的。之后又有了一个思路，就是避开数据库，直接后台操作。搞了一段时间，一直找不到一个重要的参数，最近几天终于找到了，于是就有了以下的一段代码，现在分享出来：

import requests

import json

from hashlib import md5

from bs4 import BeautifulSoup

from lxml import etree

import re

def denglu():

post_url='http://www.liaojinhua.com/zb_system/cmd.php?act=verify'

session = requests.session()

headers={

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.106 Safari/537.36'

}

s = md5()

s.update(密码.encode())

daf=s.hexdigest()

data = {

# 'btnPost': '登录',

'username': 用户名,

'password': s.hexdigest(),

# 'savedate': '1'

}

session.post(url=post_url, data=data, headers=headers)

return session

def shuru(title,biaoqian,zhengwen):

headers = {

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.106 Safari/537.36'

}

get_url = 'http://adb.com/zb_system/admin/index.php?act=ArticleMng'

session=denglu()

html = session.get(url=get_url)

ace = etree.HTML(html.text)

wenzhang = ace.xpath('//div[@class='divHeader']/text()')

print(wenzhang)

lianjian = ace.xpath('//div[@id='divMain2']/table//tr[2]/td[@class='td10 tdCenter']/a/@href')

soup = BeautifulSoup(html.text, 'lxml')

IDS = soup.find_all('td', class_='td5')

print(IDS[0].text)

ids = int(IDS[0].text)

ids+=1

url = re.sub('Del&id=\d+', 'Pst', lianjian[1])

print(url)

data = {

# 设置文章的ID

'ID':ids,

'Type': '0',

#设置标题

'Title': title,

# 'Content': '<p>23232<br/></p>',

# 'meta_jiage': None,

# 'meta_shuoming': None,

# 'meta_lianjie': None,

# 'Alias': None,

# 设置标签

'Tag': biaoqian,

# 'Intro': 'None',

# 设置文章上传分类

'CateID': '16',

'Status': '0',

# 设置文章使用模板

'Template': 'single',

# 作者ID

'AuthorID': '1',

# 'PostTime': '2020-12-15 21:12:49',时间可以不设置

# 设置文章是否置顶

'IsTop': '0',

'IsLock': '0',

# 摘要设置

# 'Intro':'None',

# 内容设置

'Content': zhengwen}

try:

res = session.post(url, data=data, headers=headers)

except Exception as f:

print(f)

python接口自动化8-参数化

前言前面一篇实现了参数的关联,那种只是记流水账的完成功能,不便于维护,也没什么可读性,接下来这篇可以把每一个动作写成一个函数,这样更方便了. 参数化的思维只需记住一点:不要写死! 一.登录函数 1. ...
python爬虫整理| 原来我曾经拥有过这么多爬虫啊

一.requests模块的学习使用事前:pip install requests 1)发送get,post请求,获取相应: response = requests.get(url) #发送get请求 ...
python接口自动化测试(四)

掌握了前面几节的的内容,就可以做一些简单的http协议接口的请求发送了,但是这些还不够.HTTP协议是一个无状态的应用层协议,也就是说前后两次请求是没有任何关系的,那如果我们测试的接口之前有相互依赖关 ...
python接口自动化3-自动发帖（session）

前言上一篇模拟登录博客园,但这只是第一步,一般登录后,还会有其它的操作,如发帖,评论等,这时候如何保持会话呢? 一.session简介 1.查看帮助文档,贴了一部分,后面省略了 >>im ...
618！京东 PC 版抢卷

来源:Python 技术「ID: pythonall」 618不到一个月了,京东 618 活动已经开始了,不知道小伙伴们参与了没.先抢一下京东的优惠劵,也许 618 出现神劵呢? 抓包分析登录获取二 ...
python接口自动化4-绕过验证码登录（cookie）

前言有些登录的接口会有验证码:短信验证码,图形验证码等,这种登录的话验证码参数可以从后台获取的(或者查数据库最直接). 获取不到也没关系,可以通过添加cookie的方式绕过验证码. 一.抓登录coo ...
教你写一个定时关机程序

前言今天,我同学问我这个程序怎么做: 于是,我用C给他写了一个类似的控制台程序: 我的这个控制台程序有8个小功能,分别是: 1.定时n秒后自动关机. 2.定时到x点x分提醒你是否要关机,如果你没确认 ...
炒股前先问自己一个问题？——只买回调支撑位——东方财富网博客

炒股前先问自己一个问题? (2020-04-24 09:47:59) 大盘涨涨跌跌也好,不死不活震荡也好.为何每天都有涨停股,强势股? 答案肯定是:有人操纵! 那么炒股第一个需要解决的问题是:怎么去发 ...
(19)一个affymetrix表达芯片实战-生信菜鸟团博客2周年精选文章集

这个实例上部分包括: 如何用R包下载GEO数据(只限单一平台,其余平台需要修改下面的代码) 如何对GEO的芯片数据归一化并且得到表达量矩阵, 如何用limma包做差异分析, 对找到的差异基因如何做GO ...
童年记忆第四弹！！！如何用Python写一个胖鸟快飞

前言写到童年游戏第四弹了,突然想到以前玩过的一个很有意思的游戏,叫胖鸟快飞,就是一只鸟,通过不断的点击调整位置,通过钢管的游戏,今天我们就来写写这个游戏吧~ 游戏开发:(胖鸟快飞)"> ...
童年记忆第三弹！！！用python写一个天天酷跑

写出来的效果图就是这样了下面就更新一下全部的代码吧还是老样子先定义 import pygame,sysimport random 写一下游戏配置 width = 1200 #窗口宽度height ...
童年记忆第二弹！！！如何用Python写一个植物大战僵尸

上次写了一个俄罗斯方块,感觉好像大家都看懂了,这次就更新一个植物大战僵尸吧植物大战僵尸的话引入需要的模块 import pygame import random 配置图片地址 IMAGE_PATH ...
如何写一个更好的Python函数？

Python虽然好用,但用好真的很难. 尤其是函数部分,只要写不好,后面的一连串人都会遭殃. 看又看不懂,测试起来也麻烦,维护又维护不动,真是让人头疼. 那怎么写好一个Python函数呢? <W ...
不到 150 行代码写一个 Python 版的贪吃蛇

来源:Python 技术「ID: pythonall」相信大家小时候应该都玩过贪吃蛇这个游戏吧,反正我小时候超喜欢玩,没其他原因,因为家里的手机上只有这一个游戏可以消磨时光.后来随着移动互联网的普及 ...
用python写一个简单的贪吃蛇游戏

不知道有多少同学跟我一样,最初接触编程的动机就是为了自己做个游戏玩? Python 虽然并不是一个"为游戏而生"的语言,但也有着自己的游戏引擎.最常用的就是 pygame.另外还有 ...

python如何写一个zblog采集程序(启明seo) | 沐白SEO博客

相关推荐