Python 爬取网页中JavaScript动态添加的内容

python / 159人浏览 / 0人评论

使用 selenium + phantomjs 实现

1、准备环境

selenium(一个用于web应用程测试的工具)安装:pip install selenium==2.48.0 必须指定版本
phantomjs(是一种***面的浏览器,用于完成网页的渲染)下载:http://phantomjs.org/download.html

2、使用


from selenium import webdriver

url = 'http://jandan.net/ooxx'
driver = webdriver.PhantomJS(
    executable_path='D:/Software/phantomjs-2.1.1-windows/bin/phantomjs.exe')  # 如果没有配置phantomjs的环境变量,需要手动指定路径
driver.get(url)

print(driver.page_source)


如果启动客户端报错:OSError: [WinError 740] 请求的操作需要提升。请使用管理员身份运行



感谢博主,喝杯咖啡~

0 条评论

还没有人发表评论

发表评论 取消回复

记住我的信息,方便下次评论
有人回复时邮件通知我