Web自动化——介绍与selenium之八大元素定位(五)
创始人
2025-05-29 14:11:13
0

1.自动化本质:

用代码模拟鼠标或键盘对浏览器进行操作

其中包含三个对象:代码,浏览器,浏览器驱动,三者关系:

代码驱动浏览器驱动

浏览器驱动解析代码,并驱动浏览器

浏览器按指令操作

2、环境配置:

2.1 安装浏览器
检查系统有无浏览器,没有则安装(建议先查看有没有对应的驱动,根据驱动版本下载相应的浏览器)

2.2 安装浏览器对应的驱动,并将驱动文件放到python安装目录下
查看浏览器版本,根据浏览器版本下载驱动,将.exe文件放至python安装路径下

2.3 安装selenium

ctrl+r -->cmd-->pip install selenium

2.4 检查环境

from selenium import webdriver
driver=webdriver.Chrome()

运行后弹出窗口,打开浏览器则环境配置成功

image.png

环境配置成功后就可以进行相关操作了。

3. 元素定位

  1. Web页面的元素

1)图片

2)链接

3)文本框

4)按钮

5)下拉列表

6)视频

……

比如百度的首页,在这张页面上有输入框、按钮和文字链接等,自动化要做的就是模拟鼠标和键盘来操作这些元素,或单击,或输入等。 操作这些元素的前提是要找到它们,如何来找到它们?这就需要用到元素定位的方法来找到相应的元素再进行操作

4. 元素定位的方法

1)id

2)name

3)class name

4)tag name

5)link text

6)partial link text

7)css selector

8)xpath

5. 8大定位:

# 引入库
from selenium import webdriver# 打开谷歌浏览器,建立会话。启动Chromedriver.exe  打开Chrome
driver = webdriver.Chrome()      # 启动谷歌浏览器
# driver = webdriver.Firefox()   # 启动火狐浏览器
# driver = webdriver.Ie()        # 启动IE浏览器# 访问百度首页
driver.get("http://www.baidu.com")# 窗口最大化
driver.maximize_window() 

1. id定位—首选

#id定位,属性 + 操作 = 返回 webELement 对象
ele1 = driver.find_element_by_id("kw")
print(ele1)

2. 标签名定位 tag_name(译:泰格.内幕),不能唯一的找到特定的元素

ele2 = driver.find_element_by_tag_name("input")  # (译:泰格.内幕)在dom页面当中,匹配到的第一个元素
print(ele2)
eles = driver.find_elements_by_tag_name("input")    # 列表,元素为webELement对象  全部匹配的元素
print(eles)

3.class_name 定位  (不能唯一的找到特定的元素

driver.find_element_by_class_name("s_ipt")
driver.find_elements_by_class_name("s_ipt")

4.name 定位 不唯一

driver.find_element_by_name("wd")
driver.find_elements_by_name("wd")

以上四种元素定位针对所有元素

5.link_text 定位,完整匹配文本值

driver.find_element_by_link_text("更多产品")  

6.partial_link_text 定位,(扒手.理科.泰克斯特)部分匹配上

driver.find_element_by_partial_link_text("产品") 

1 开发不一定写,2、3、4、5、6 定位方法结果不唯一,不经常用

7. xpath 定位(谷歌)

语法

/:

-   绝对定位   —— 一般不用,兼容性太差,太依赖位置

//:

-   相对定位 —— 一般用相对定位,来进行定位
-   从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置  

.:

-   选取当前节点  

…:

-   选取当前节点的父节点  

@:

-   选取属性
-   @class="xxx" , 属性放在中括号 【】中    

*:

-   通配符。匹配所有 //*  

@*:

-   通配符。匹配所有属性 //*[@*="hello"]  

多条件查询,使用逻辑查询

-   and        全部为真
-   or          其中一个为真
-   语法://input[@id="kw" and @name="wd"]

浏览器的快捷键    F12  ---->   Ctrl + F 打开定位栏

1、使用:标签名 + 节点属性定位   (可以家  and   or)
  • 语法://标签名[@属性名=值]
  • //input[@id=“kw” and @name=“wd”]

2、使用:文本内容匹配:函数:text()
  • 文本全部匹配:text()=“文本内容”

    • //a[text()=“更多产品”]
  • 文本部分匹配:contains(text(),部分文本内容)

    • (译:康ten死)
    • //a[contains(text(),“产品”)]

3、通过部分属性值匹配
  • 语法://标签名[contains(@属性名,部分属性值)]
  • //a[contains(@href,“om/more/”) and @class=“bri”]

4、层级定位:
  • 先确定节点的父节点,在找子节点;单斜杠只能找到儿子级,不能找到孙子级;双斜杠兼容新高
  • //div[@id=“u1”]//a[@name=“tj_login”]

5、xpath轴定位语法

使用语法:使用单斜杠

已知的元素定位/下面的轴名称::标签名称[@属性=值]

例://p[@title=“2016”]/following-sibling::p[@class=“name”]

image.png
轴名称及意思

ancestor:(译:昂赛斯 特儿)

  • 当前节点之前的所有父节点

parent:(译:潘润特)

  • 当前节点的父节点

preceding:(译:普瑞sei定)

  • 当前节点之前的所有节点

preceding-sibling:(译:普瑞 sei 定。塞玻璃)

  • 当前节点之前的所有同级节点

following:(译:fao lin)

  • 当前节点之后的所有节点

following-sibling:(译:fao lin 。塞玻璃)

  • 当前节点之后的所有同级节点

child

  • 当前节点的子节点

self

  • 当前节点本身

8. css 定位------自行搞定

css  效率比较高,难学,表达式比较长,可能看不懂;

xpath 是比css效率低,但是 xpath 稳定,简单

都是万能定位掌握一种就可以了

浏览器自带的css、xpath、js定位方式

image.png

以上就是常用的元素定位方法,大多数元素可以用以上方法定位到,如果有特殊元素无法定位,可以参考xpath的轴定位方式。

 from selenium import webdriver
import time# 打开谷歌浏览器,建立会话。启动Chromedriver.exe  打开Chrome
driver = webdriver.Chrome()# 访问百度首页
driver.get("http://www.baidu.com")
time.sleep(2)   # 强制等待2秒
# 定位某度首页登录按钮,点击登录按钮
driver.find_element_by_xpath('//div[@id="u1"]//a[@name="tj_login"]').click()
time.sleep(2)   # 强制等待2秒
driver.quit()   # 关闭浏览器

6. selenium模块中的find_element_by_id方法无法使用,改用driver.find_element(by=By.ID, value=None)

如果遇到找不到方法的情况,如果自己的版本是最新的版本,那么很有可能这种方法已经不用了

可以去查看一下官方的文档,或者直接查看配置文件,对自己的代码进行修改

driver.find_element(By.XPATH, '//*[@id="kw"]') 
# 根据xpath选择元素(万金油)
driver.find_element(By.CSS_SELECTOR, '#kw') 
# 根据css选择器选择元素
driver.find_element(By.NAME, 'wd') 
# 根据name属性值选择元素
driver.find_element(By.CLASS_NAME, 's_ipt') 
# 根据类名选择元素
driver.find_element(By.LINK_TEXT, 'hao123') 
# 根据链接文本选择元素
driver.find_element(By.PARTIAL_LINK_TEXT, 'hao') 
# 根据包含文本选择
driver.find_element(By.TAG_NAME, 'title') 
# 根据标签名选择
# 目标元素在当前html中是唯一标签或众多标签第一个时候使用
driver.find_element(By.ID, 'su') 
# 根据id选择

总结

最后送上一句话:
世界的模样取决于你凝视它的目光,自己的价值取决于你的追求和心态,一切美好的愿
望,不在等待中拥有,而是在奋斗中争取。

相关内容

热门资讯

银行、消金公司助贷余额增速不得... 近日,中国证券报记者从多位业内人士处独家获悉,5月以来,多地金融监管部门对部分中小银行、消金公司下达...
朱鸿接任陈航,担任钉钉科技有限... 消费日报-今朝新闻讯 天眼查显示,6月23日,钉钉科技有限公司发生工商变更,陈航卸任法定代表人、董事...
3日累跌超20%,德创环保:公... 6月25日, 德创环保(603177.SH)公告,公司股票于2026年6月23日、6月24日和6月2...
北京发布2026年第七轮拟供商... 央广网北京6月25日消息(记者门庭婷)6月25日,北京市规划和自然资源委员会网站发布了2026年第七...
开放麦 | 启明创投胡奇:从A... “2026年,创投圈的浪潮再次翻涌:AI从技术概念走进产业深水区,硬科技创业从“小众赛道” 变成“主...
腾讯孙忠怀:在行业转身处 6月24日,2026腾讯视频年度发布在上海举行。腾讯公司副总裁、腾讯在线视频董事长孙忠怀以《在行业转...
加息,突变!美联储,重磅传来!... 美联储政策路径突生变数。 美国商务部经济分析局最新公布的数据显示,5月个人消费支出(PCE)物价指数...
6月合肥上门收金必看!5步避坑... 2026年6月,合肥黄金市场持续高位运行,不少市民翻出家里闲置的旧金饰、投资金条想变现,上门回收因为...
潮汕女富豪挂帅后加码液冷!祥鑫... 潮汕女强人,带着百亿公司加码液冷散热。 6月24日晚间,祥鑫科技(002965.SZ)公告称,公司董...
马斯克向太空要电,GobiX ... 一场关于「去哪里找电」的全球竞赛,正在朝两个方向展开。 作者|周永亮 编辑| 郑玄 「太空光伏是不是...
原料药行业陷入周期低谷 有药企... 每经记者|许立波 每经编辑|魏文艺 “过完年到现在,我们整个团队每个月都在出差,跑遍了亚非拉、欧美市...
家门口筛查白内障!永顺泽家镇暖... 大众卫生报·新湖南客户端6月25日讯(通讯员 彭雪姣)为切实解决辖区老年性白内障患者异地就医奔波、就...
终于等到!油价马上再大跌,这个... 点击添加图片描述(最多60个字) 编辑 各位车主朋友,好消息接二连三! 继6月18日油价大幅下调...
丈量出海新路 世界酒庄影响力指... 长期以来,全球酒庄评价体系由西方机构主导,且大多局限于单一酒种、单一评价维度,这一局面正逐渐被打破。...
峰瑞资本创始合伙人李丰:从资本... “2026年,创投圈的浪潮再次翻涌:AI从技术概念走进产业深水区,硬科技创业从“小众赛道” 变成“主...
原创 A... 迈向成熟,还有茁壮成长的机会。 作者 | 方璐 编辑丨于婞 来源 | 野马财经 2026年6月21日...
为企业解锁出海新通道!亚太中小... 6月24日下午,作为2026年APEC中小企业工商论坛的重要组成部分,亚太中小企业国际化合作发展论坛...
君赛生物港股IPO,增聘兴证国... 跟丰宜科技一样,正冲刺港股IPO的上海君赛生物股份有限公司(简称“君赛生物”)增聘一位整体协调人。 ...
圣邦股份明日上市:暗盘涨24%... 雷递网 雷建平 6月25日 圣邦微电子(北京)股份有限公司(简称:“圣邦股份”,股票代码:“0366...
科技“吃肉”,券商跟着“喝汤”... 当科技持续成为市场核心主线,押中硬科技项目的券商也成为被追逐的焦点。 6月24日,半导体零部件概念股...