python-xpath获取html文档的部分内容
有些时候我在们需要的用正则提取出html中某一个部分的文字内容,如图:
我们需要对Element进行处理,用到name1 = html.tostring(name[0]),代码如下:
from lxml import html import requests url = 'http://navi.cnki.net/knavi/JournalDetail/GetArticleList?year=2018&issue=04&pykm=DZXU&pageIdx=0&pcode=CJFD' res = requests.get(url) tree = html.fromstring(res.text) name = tree.xpath("//dd[@class='row clearfix ']") name1 = html.tostring(name[0]) print(name1)
打印截图:
那么此时就已经大功告成了!!!
以上这篇python-xpath获取html文档的部分内容就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持来客网。