Web自动化——介绍与selenium之八大元素定位(五)
创始人
2025-05-29 14:11:13
0

1.自动化本质:

用代码模拟鼠标或键盘对浏览器进行操作

其中包含三个对象:代码,浏览器,浏览器驱动,三者关系:

代码驱动浏览器驱动

浏览器驱动解析代码,并驱动浏览器

浏览器按指令操作

2、环境配置:

2.1 安装浏览器
检查系统有无浏览器,没有则安装(建议先查看有没有对应的驱动,根据驱动版本下载相应的浏览器)

2.2 安装浏览器对应的驱动,并将驱动文件放到python安装目录下
查看浏览器版本,根据浏览器版本下载驱动,将.exe文件放至python安装路径下

2.3 安装selenium

ctrl+r -->cmd-->pip install selenium

2.4 检查环境

from selenium import webdriver
driver=webdriver.Chrome()

运行后弹出窗口,打开浏览器则环境配置成功

image.png

环境配置成功后就可以进行相关操作了。

3. 元素定位

  1. Web页面的元素

1)图片

2)链接

3)文本框

4)按钮

5)下拉列表

6)视频

……

比如百度的首页,在这张页面上有输入框、按钮和文字链接等,自动化要做的就是模拟鼠标和键盘来操作这些元素,或单击,或输入等。 操作这些元素的前提是要找到它们,如何来找到它们?这就需要用到元素定位的方法来找到相应的元素再进行操作

4. 元素定位的方法

1)id

2)name

3)class name

4)tag name

5)link text

6)partial link text

7)css selector

8)xpath

5. 8大定位:

# 引入库
from selenium import webdriver# 打开谷歌浏览器,建立会话。启动Chromedriver.exe  打开Chrome
driver = webdriver.Chrome()      # 启动谷歌浏览器
# driver = webdriver.Firefox()   # 启动火狐浏览器
# driver = webdriver.Ie()        # 启动IE浏览器# 访问百度首页
driver.get("http://www.baidu.com")# 窗口最大化
driver.maximize_window() 

1. id定位—首选

#id定位,属性 + 操作 = 返回 webELement 对象
ele1 = driver.find_element_by_id("kw")
print(ele1)

2. 标签名定位 tag_name(译:泰格.内幕),不能唯一的找到特定的元素

ele2 = driver.find_element_by_tag_name("input")  # (译:泰格.内幕)在dom页面当中,匹配到的第一个元素
print(ele2)
eles = driver.find_elements_by_tag_name("input")    # 列表,元素为webELement对象  全部匹配的元素
print(eles)

3.class_name 定位  (不能唯一的找到特定的元素

driver.find_element_by_class_name("s_ipt")
driver.find_elements_by_class_name("s_ipt")

4.name 定位 不唯一

driver.find_element_by_name("wd")
driver.find_elements_by_name("wd")

以上四种元素定位针对所有元素

5.link_text 定位,完整匹配文本值

driver.find_element_by_link_text("更多产品")  

6.partial_link_text 定位,(扒手.理科.泰克斯特)部分匹配上

driver.find_element_by_partial_link_text("产品") 

1 开发不一定写,2、3、4、5、6 定位方法结果不唯一,不经常用

7. xpath 定位(谷歌)

语法

/:

-   绝对定位   —— 一般不用,兼容性太差,太依赖位置

//:

-   相对定位 —— 一般用相对定位,来进行定位
-   从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置  

.:

-   选取当前节点  

…:

-   选取当前节点的父节点  

@:

-   选取属性
-   @class="xxx" , 属性放在中括号 【】中    

*:

-   通配符。匹配所有 //*  

@*:

-   通配符。匹配所有属性 //*[@*="hello"]  

多条件查询,使用逻辑查询

-   and        全部为真
-   or          其中一个为真
-   语法://input[@id="kw" and @name="wd"]

浏览器的快捷键    F12  ---->   Ctrl + F 打开定位栏

1、使用:标签名 + 节点属性定位   (可以家  and   or)
  • 语法://标签名[@属性名=值]
  • //input[@id=“kw” and @name=“wd”]

2、使用:文本内容匹配:函数:text()
  • 文本全部匹配:text()=“文本内容”

    • //a[text()=“更多产品”]
  • 文本部分匹配:contains(text(),部分文本内容)

    • (译:康ten死)
    • //a[contains(text(),“产品”)]

3、通过部分属性值匹配
  • 语法://标签名[contains(@属性名,部分属性值)]
  • //a[contains(@href,“om/more/”) and @class=“bri”]

4、层级定位:
  • 先确定节点的父节点,在找子节点;单斜杠只能找到儿子级,不能找到孙子级;双斜杠兼容新高
  • //div[@id=“u1”]//a[@name=“tj_login”]

5、xpath轴定位语法

使用语法:使用单斜杠

已知的元素定位/下面的轴名称::标签名称[@属性=值]

例://p[@title=“2016”]/following-sibling::p[@class=“name”]

image.png
轴名称及意思

ancestor:(译:昂赛斯 特儿)

  • 当前节点之前的所有父节点

parent:(译:潘润特)

  • 当前节点的父节点

preceding:(译:普瑞sei定)

  • 当前节点之前的所有节点

preceding-sibling:(译:普瑞 sei 定。塞玻璃)

  • 当前节点之前的所有同级节点

following:(译:fao lin)

  • 当前节点之后的所有节点

following-sibling:(译:fao lin 。塞玻璃)

  • 当前节点之后的所有同级节点

child

  • 当前节点的子节点

self

  • 当前节点本身

8. css 定位------自行搞定

css  效率比较高,难学,表达式比较长,可能看不懂;

xpath 是比css效率低,但是 xpath 稳定,简单

都是万能定位掌握一种就可以了

浏览器自带的css、xpath、js定位方式

image.png

以上就是常用的元素定位方法,大多数元素可以用以上方法定位到,如果有特殊元素无法定位,可以参考xpath的轴定位方式。

 from selenium import webdriver
import time# 打开谷歌浏览器,建立会话。启动Chromedriver.exe  打开Chrome
driver = webdriver.Chrome()# 访问百度首页
driver.get("http://www.baidu.com")
time.sleep(2)   # 强制等待2秒
# 定位某度首页登录按钮,点击登录按钮
driver.find_element_by_xpath('//div[@id="u1"]//a[@name="tj_login"]').click()
time.sleep(2)   # 强制等待2秒
driver.quit()   # 关闭浏览器

6. selenium模块中的find_element_by_id方法无法使用,改用driver.find_element(by=By.ID, value=None)

如果遇到找不到方法的情况,如果自己的版本是最新的版本,那么很有可能这种方法已经不用了

可以去查看一下官方的文档,或者直接查看配置文件,对自己的代码进行修改

driver.find_element(By.XPATH, '//*[@id="kw"]') 
# 根据xpath选择元素(万金油)
driver.find_element(By.CSS_SELECTOR, '#kw') 
# 根据css选择器选择元素
driver.find_element(By.NAME, 'wd') 
# 根据name属性值选择元素
driver.find_element(By.CLASS_NAME, 's_ipt') 
# 根据类名选择元素
driver.find_element(By.LINK_TEXT, 'hao123') 
# 根据链接文本选择元素
driver.find_element(By.PARTIAL_LINK_TEXT, 'hao') 
# 根据包含文本选择
driver.find_element(By.TAG_NAME, 'title') 
# 根据标签名选择
# 目标元素在当前html中是唯一标签或众多标签第一个时候使用
driver.find_element(By.ID, 'su') 
# 根据id选择

总结

最后送上一句话:
世界的模样取决于你凝视它的目光,自己的价值取决于你的追求和心态,一切美好的愿
望,不在等待中拥有,而是在奋斗中争取。

相关内容

热门资讯

当对手都在做下沉 蜜雪冰城旗下... [ 今年5月,蜜雪集团跟巴西签署40亿元人民币的采购意向大单,其中大多数是咖啡豆。 ] 当星巴克、瑞...
新手必看!股指期货交易规则基础... 股指期货交易规则,看似复杂抽象,实则与我们的日常生活有着奇妙的共通之处。它就像一场精心编排的生活交响...
王登发履新茅台技开公司“一把手... 一则微信公众号发布的信息,披露了茅台集团旗下的技术开发公司“一把手”已换人。 近日,南都湾财社-酒水...
特斯拉机器人V3量产版亮相!马... 快科技7月27日消息,特斯拉的Optimus人形机器人V3量产版终于要来了!马斯克在最近的财报电话会...
原创 中... 在金融全球化的浪潮中,中国资本市场始终勇立潮头,不断探索前行。7月26日,中国资本市场学会成立大会暨...
报告:我国经济增长保持韧性 下... 央广网北京7月27日消息(记者 樊瑞)近日,中国金融四十人论坛(CF40论坛)发布《2025年第二季...
超6300亿元!A股银行“分红... 7月25日,成都银行完成权益分派股权登记,将于7月28日发放现金红利,这标志着A股上市银行2024年...
老铺黄金:2025年上半年单个... 7月27日晚,老铺黄金(HK06181)披露2025年中期业绩预告。预计2025年上半年实现销售业绩...
保险行业2025年上半年回顾与... 今天分享的是:保险行业2025年上半年回顾与未来展望 报告共计:59页 2025年上半年保险行业回顾...
数币App上新!消费者、商户两... 数字人民币试点持续推进,相关数字钱包手机应用程序功能也在优化中。7月21日,北京商报记者注意到,日前...
A股热点迭出,个股连续涨停!资... 近段时间以来A股市场整体走势较为强劲,上周以来在雅江概念集体上行的推动下涨势更为明显,主要指数不同程...
原创 印... 令人惊讶的是,印度人开始反思自身制造业的发展状况。印度经济学家帕纳加利亚指出,印度原本有机会在20年...
首创证券拟赴港上市,“A+H”... 首创证券在A股上市不足三年便启动赴港上市计划。近日,首创证券公告称,公司董事会已审议通过了公司拟发行...
肥东杨大爷要帮“儿子”还钱,银... “儿子”在外借了2万元还不上 “要债人”电话直接打了过来 还?还是不还? 7月6日 肥东县公安局梁园...
A股上周16家上市公司公布并购... 转自:扬子晚报 扬子晚报网7月27日讯(记者 范晓林 薄云峰)近段时间以来,A股市场并购重组活跃度持...
独家|某股份行改动零售业务关键... 在资产端信贷“投不动”(多家行零售信贷增速连续几个季度放缓、更有甚者个贷投放负增长)、负债端存款“定...
四川五日游报团指南及详细行程,... 四川,这片位于中国西南的神奇土地,以其独特的自然风光、丰富的文化遗产和诱人的美食而闻名遐迩。从成都的...
原创 中... 在2025年4月初,时任美国总统的特朗普正式启动了针对世界各国的关税战,旨在通过实施经济制裁来促进美...
牛市主升浪开启了?别急!珍惜布... 本周,A股市场上行,主要宽基指数都收获了或多或少的周涨幅,其中,科创50、微盘股涨幅居前。板块方面,...
公募二季报两大看点!港股配置逼... 本报(chinatimes.net.cn)记者栗鹏菲 叶青 北京报道 2025年公募基金二季报披露收...