博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
BeautifulSoup
阅读量:5020 次
发布时间:2019-06-12

本文共 569 字,大约阅读时间需要 1 分钟。

findAll(tag,attributes,recursive,text,limit,keywords)find(tag,attributes,recursive,text,keywords)

标签参数tag,他可以传一个标签的名称或多个标签名称组成的Python列表做标签参数.

bsObj.find_all({
'h1','h2','h3'})

属性参数attributes使用一个Python字典封封装一个标签的若干属性和对应的属性值.

bsObj.find_all('span',{
'green','red'})

在运行带有class的属性查找是会报错:

bsObj.find_all(class='green')

不过,可以用Beautiful提供的臃肿的方案:在class后面加一个下划线:

bsObj.find_all(class_='green')

与lambda一起使用

soup.find_all(lambda tag: len(tag.attrs) == 2)

会找出例如下面的标签:

在BeautifulSoup这里面使用lambda表达式选择标签,将是正则表达式的完美代替方案.

 

转载于:https://www.cnblogs.com/zhaijihai/p/10313321.html

你可能感兴趣的文章
Expression Blend实例中文教程(1) - 开篇
查看>>
Redis哨兵模式
查看>>
mongoengine
查看>>
正则表达式-包含A字符串且不包含B字符串
查看>>
MATLAB入门学习(整合)
查看>>
page=new page($total,$listrows,$query,$ord)之$query
查看>>
Android读取url图片保存及文件读取
查看>>
完整ASP.Net Excel导入
查看>>
判断CPU大小端示例代码
查看>>
ARTS打卡第13周
查看>>
循环队列的运用---求K阶斐波那契序列
查看>>
pta 编程题14 Huffman Codes
查看>>
初始化bootstrap treeview树节点
查看>>
python selenium向<sapn>标签中写入内容
查看>>
一次电脑上不去网的拯救之路
查看>>
JS常用坐标
查看>>
使用”结构化的思考方式“来编码和使用”流程化的思考方式“来编码,孰优孰劣?...
查看>>
C#调用斑马打印机打印条码标签(支持COM、LPT、USB、TCP连接方式和ZPL、EPL、CPCL指令)【转】...
查看>>
关于git的认证方式
查看>>
字符串按照字典序排列
查看>>