Skip to main content
 首页 » 编程设计

python之如何使用pyquery按文本获取元素

2025年04月02日23zhujiabin

我正在写一个蜘蛛,我想知道哪个链接是“下一页”的意思,所以我需要通过值=“下一页”获取元素,然后获取链接。 不是只有一个标签,而是一整套html源码,我想得到具体的链接。

如果我想得到一个像

这样的元素
`<a href="http://*****">..</a>` 

我可以用

`'a[href^="http"]'` 

我试试

`'a[text="value"]'` 

请您参考如下方法:

尝试“包含”:

from pyquery import PyQuery as pq 
 
doc = pq("<html><body><a href='https://stackoverflow.com'>Next page</a><p>...Next time...</p></body></html>") 
 
el = doc('a:Contains("Next")') 
el.text()         # 'Next page' 
el.attr['href']   # 'https://stackoverflow.com'