博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
urllib2抓取HTML存入Excel
阅读量:6636 次
发布时间:2019-06-25

本文共 329 字,大约阅读时间需要 1 分钟。

 通过urllib2抓取HTML网页,然后过滤出包含特定字符的行,并写入Excel文件:

# -*- coding: utf-8 -*-import sys#import urllibimport urllib2from xlwt import Workbookdef getdata(keywords, line):    date = ''    if keywords in line: # 本行包含keywords        start = line.find('>',)        end = line.find('

输出结果:

 

转载于:https://www.cnblogs.com/ruanchao/p/5879023.html

你可能感兴趣的文章
DAHDI 卡安装配置
查看>>
IE 8下的pdf打不开
查看>>
openwrt linux portal 实现 支持 https 支持基于时长和流量控制
查看>>
RSF 分布式服务框架设计
查看>>
solaris学习9:NFS
查看>>
JSONModel的使用
查看>>
充电第二天
查看>>
JAX-WS
查看>>
easyrec——一个开源推荐系统
查看>>
C++ wait/notify机制
查看>>
Java线程
查看>>
spring cloud
查看>>
Binder进程间通信(二)---- 驱动程序初始化
查看>>
redis sentinel 主从切换(failover)解决方案,详细配置
查看>>
Java 8: 从永久代(PermGen)到元空间(Metaspace)
查看>>
Lua 5.3.3 一个string.len的异常
查看>>
Hadoop2.2.0 入门教程(三)之HDFS SHELL脚本
查看>>
吉软—Java-Css+Div 实现导航
查看>>
jquery banner 轮播配置方法
查看>>
Linux 关机前执行脚本
查看>>