网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
可签
7
级以上的吧
50
个
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
04月19日
漏签
0
天
python2吧
关注:
82
贴子:
200
看贴
图片
吧主推荐
游戏
5
回复贴,共
1
页
<返回python2吧
>0< 加载中...
如何使用Python来生成sitemap
只看楼主
收藏
回复
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
在做网站项目时,经常会使用脚本生成sitemap, 便于爬虫爬取,有利于SEO。 那么如何使用Python来生成sitemap呢?下面我们来研究一番。
安装lxml
首先需要pip install lxml安装lxml库。
如果你在ubuntu上遇到了以下错误:
送TA礼物
IP属地:湖南
1楼
2017-06-13 22:23
回复
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
请安装以下依赖:
sudo apt-get install libxml2-dev libxslt1-dev
IP属地:湖南
2楼
2017-06-13 22:29
回复
收起回复
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
Python代码
下面是生成sitemap和sitemapindex索引的代码,可以按照需求传入需要的参数,或者增加字段:
IP属地:湖南
3楼
2017-06-13 22:30
回复
收起回复
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
效果
生成的效果应该是这种格式:
sitemap格式:
IP属地:湖南
4楼
2017-06-13 22:31
回复
收起回复
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
lastmod时间格式的问题
格式是用ISO 8601的标准,如果是linux/unix系统,可以使用以下函数获取
IP属地:湖南
5楼
2017-06-13 22:31
回复
收起回复
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
优化
一般来说,用lxml效率低并且内存占用比较大,可以直接用文件的write方法创建。
IP属地:湖南
6楼
2017-06-13 22:32
回复
收起回复
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧热议榜
1
上岸第一件事:剑斩意中人
1611660
2
关税行不通川普该打下一张牌了
1205559
3
iG极限翻盘2-1拿下JDG
1171940
4
王曼昱2-4蒯曼止步8强
954477
5
如何看待泽连斯基向中国泼脏水
850564
6
T1不敌BFX输在哪
748000
7
日本多地发生无差别杀人事件
746784
8
林诗栋4比0莫雷加德进4强
728134
9
江西景德镇工伤纠纷酿惨案
698126
10
王楚钦险胜杜达进入四强
570486
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示