python爬虫之selenium--获取HTML源码断言和URL地址

前言

在做测试的时候经常会使用selenium获取网页url与源代码,判断当前执行是否正确,接下来我们一起看下如果通过selenium获取url及网页源代码

获取HTML源码

from selenium import webdriver
import unittest


class Test_source(unittest.TestCase):
    def Test_getPageSource(self):
        url = 'http://www.sogou.com'
        self.driver = webdriver.Chrome()
        self.driver.get(url)

        # 调取driver的page_source属性获取页面源码
        pageSource = self.driver.page_source

        print('当前网页的源码:', pageSource)

        # 断言页面源码中是否包含"新闻"两个关键字,以此判断页面内容是否正确
        self.assertTrue(u"新闻" in pageSource, "页面源码中未找到新闻关键字")


test1 = Test_source()
test1.Test_getPageSource()

获取URL地址

from selenium import webdriver
import unittest


class Test_Pageurl(unittest.TestCase):
    def test_getCurrentPageUrl(self):
        url = 'http://www.sogou.com'
        self.driver = webdriver.Chrome()
        self.driver.get(url)

        # 获取当前页面的url
        currentPageUrl = self.driver.current_url
        print('当前网页的url:', currentPageUrl)

        # 断言当前网页的网址是否为 https://www.sogou.com/
        self.assertEqual(currentPageUrl, 'https://www.sogou.com/', "当前网页网址非预期")


test1 = Test_Pageurl()
test1.test_getCurrentPageUrl()

断言源码中的关键字

from selenium import webdriver
import unittest
import time


class Test_KeyWord(unittest.TestCase):
    def test_assertKeyWord(self):
        url = 'http://www.baidu.com'
        self.driver = webdriver.Chrome()
        self.driver.get(url)
        self.driver.find_element_by_id('kw').send_keys('自动化测试')
        self.driver.find_element_by_id('su').click()
        time.sleep(4)
        assert '自动化' in self.driver.page_source, '页面中不存在该关键字'


test1 = Test_KeyWord()
test1.test_assertKeyWord()

python爬虫之selenium-介绍和安装

python爬虫之selenium-浏览器操作方法

python爬虫之selenium-元素的定位

python爬虫之selenium--Xpath定位

python爬虫之selenium--iframe

python爬虫之selenium--单选下拉列表

python爬虫之selenium--鼠标操作

python爬虫之selenium--键盘操作

python爬虫之selenium--等待的三种方式

python爬虫之selenium--多窗口操作

python爬虫之selenium--操作JS弹框

python爬虫之selenium--上传文件

python爬虫之selenium--浏览器窗口截图

python爬虫之selenium--加载浏览器配置

python爬虫之selenium--表格和复选框的定位

python爬虫之selenium--获取HTML源码断言和URL地址

python爬虫之selenium--设置浏览器的位置和高度宽度

python爬虫之selenium--页面元素相关的操作

python爬虫之selenium--浏览器滚动条操作

python爬虫之selenium--拖拽页面元素

python爬虫之selenium--页面元素是否可见和可操作

python爬虫之selenium--高亮显示正在操作的元素

python爬虫之selenium--更改标签的属性值

python爬虫之selenium--单选框和复选框的操作

python爬虫之selenium--cookie操作

python爬虫之selenium--记录日志信息

转自:https://www.cnblogs.com/zouzou-busy/p/11216291.html