拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条正文

【Python爬虫】: Selenium自动化进阶,它能做的不仅仅是爬虫

任佳伟
以中国亚马逊卖家为中心,引导每一个卖家,运用互联网产品运营的思维去经营自己的店铺和产品,希望能把每一家在亚马逊上卖货的公司,变成一家互联网公司.让爆单成为每个卖家日常生活的一部分.
20402
2018-12-26 19:05

哈喽,之前为大家介绍了Selenium的基本用法,使用Selenium获取网页源码再解析数据的方式来完成数据的爬取。

除此之外,它还有更多的进阶功能,今天在这里就位大家介绍用Selenium的鼠标键盘操作(ActionChains)和使用Selenium实现验证码破解。

仔细往下看,你会发现很多所谓的黑科技原来你也可以实现!



PART

01


用Selenium做自动化,有时候会遇到需要模拟鼠标操作才能进行的情况,比如单击、双击、点击鼠标右键、拖拽等等。而Selenium给我们提供了一个类来处理这类事件——ActionChains。


selenium.webdriver.common.action_chains.ActionChains(driver)


ActionChains类基本能够满足我们所有对鼠标操作的需求。


以下是罗列的ActionChains方法:


# 单击鼠标左键
click(
on_element=None)
# 点击鼠标左键,不松开
click_and_hold(
on_element=None)
# 点击鼠标右键
context_click(
on_element=None)
# 双击鼠标左键
double_click(
on_element=None)
# 拖拽到某个元素然后松开
drag_and_drop(source
, target)
# 拖拽到某个坐标然后松开
drag_and_drop_by_offset
(source
, xoffset, yoffset)
# 按下某个键盘上的键
key_down(value
, element=None)
# 松开某个键
key_up(value
, element=None)
# 鼠标从当前位置移动到某个坐标

move_by_offset(xoffset
, yoffset)
# 鼠标移动到某个元素
move_to_element(to_element)
# 移动到距某个元素(左上角坐标)多少距离的位置
move_to_element_with_offset
(to_element
, xoffset, yoffset)
# 执行链中的所有动作
perform()
# 在某个元素位置松开鼠标左键
release(
on_element=None)
# 发送某个键到当前焦点的元素
send_keys(*keys_to_send)
# 发送某个键到指定元素
send_keys_to_element
(element
, *keys_to_send)


PART

02


接下来用亚马逊相关事例,来详细说明和演示每一个方法的用法:


1、点击操作:打开亚马逊→搜索“echo→自动翻页。


import time
from selenium import webdriver
# 生成浏览器对象
browser = webdriver.Firefox()
# 使浏览器访问 https://www.amazon.com/。
browser.get('https://www.amazon.com/')
# 找到亚马逊的搜索框并输入‘echo’。
browser.find_element_by_xpath
(
'//*[@id="twotabsearchtextbox"]')
.send_keys(
'echo')
# 输入‘echo'后点击放大镜标志的搜索按钮。
browser.find_element_by_xpath
(
'//*[@id="nav-search"]/form/div[2]
/div/input'
).click()
# 在每页停顿5秒后,点击翻页按钮。
while True:
    time.sleep(
5)
    browser.find_element_by_xpath
    (
'//*[@id="pagnNextString"]').click()


2、标移动:打开亚马逊→将鼠标移动到切换语言的按钮上→将鼠标移动到登陆按钮上。


import time
from selenium import webdriver
from selenium.webdriver.common.
action_chains
import ActionChains
# 生成浏览器对象
browser = webdriver.Firefox()
# 使浏览器访问 https://www.amazon.com/。
browser.get('https://www.amazon.com/')
# 找到亚马逊主页切换语言的element。
language = browser.find_element_by_xpath
(
'//*[@id="icp-nav-flyout"]')
# 找到亚马逊主页登陆的element。
sign_in = browser.find_element_by_xpath
(
'//*[@id="nav-link-accountList"]')
# 生成ActionChains对象。
action = ActionChains(browser)
# 将鼠标移动到亚马逊主页切换语言的element。
action.move_to_element(language).perform()
time.sleep(
5)
# 将鼠标移动到亚马逊主页登陆的element。
action.move_to_element(sign_in).perform()
time.sleep(
5)
# 将鼠标移动到亚马逊主页登陆的element。
action.move_to_element(sign_in).perform()
time.sleep(
5)


3、拖拽:将亚马逊主页的Logo拖入搜索框中。(可用于破解滑块验证码中)


from selenium import webdriver
from selenium.webdriver.common.
action_chains
import ActionChains
# 生成浏览器对象
browser = webdriver.Firefox()
# 使浏览器访问 https://www.amazon.com/。
browser.get('https://www.amazon.com/')
# 找到亚马逊主页搜索框左边的亚马逊LOGO。
logo = browser.find_element_by_xpath
(
'/html/body/div[1]/header/div
/div[1]/div[1]/div/a/span[1]'
)
# 找到亚马逊搜索框
Search_Bar = browser.find_element_by_xpath
(
'//*[@id="twotabsearchtextbox"]')
# 将亚马逊logo移动到搜索框
action = ActionChains(browser)
action.drag_and_drop
(logo
, Search_Bar).perform()


温馨提示:拖拽使用时注意加等待时间,有时会因为速度太快而失败。

——贴心的小编




4、截图:配合打码平台破解亚马逊验证码。


from selenium import webdriver
from selenium.webdriver.common.
action_chains
import ActionChains
# 生成浏览器对象
browser = webdriver.Firefox()
# 使浏览器访问 https://www.amazon.com/。
browser.get('https://www.amazon.com/')
# 获取当前浏览器title
title = browser.title
# 如果浏览器title 等于 “Robot Check”
if title == 'Robot Check':
   
# 找到验证码图片element
   
code_image_div = browser.find_element_
    by_xpath(
'/html/body/div/div[1]/div[3]
    /div/div/form/div[1]/div/div/div[1]/img'
)
   
# 截取验证码图片,并以"code.png"命名保存。
   
code_image_div.screenshot('code.png')
   
# 对接打码平台 上传验证码图片。
   
rc = RClient('username',
    'password', '105391', 'softid')
    im1 =
open('a.png', 'rb').read()
   
print("正在识别验证码...")
   
# 获取返回的验证码
   
response = (rc.rk_create(im1, 2060))
    code = response[
'Result']
   
print('验证码为:' + code)
   
# 找到验证码输入框并输入验证码
   
browser.find_element_by_xpath
   (
'//*[@id="captchacharacters"]')
    .send_keys(code)
   
# 点击 确定 按钮。
   
browser.find_element_by_xpath
    (
'/html/body/div/div[1]/div[3]
    /div/d
iv/form/div[2]/
   div/span/span/button'
).click()


有了以上这些方法,我相信已经有一些同学想到用它们干什么了吧?方法有了,看你自己怎么使用它哦!


PART

03


简单一句就是Selenium可以完成大多数跟真人一样的操作。

你可以在写好程序后冲一杯咖啡,静静的看着它帮你完成点击、浏览的操作,就算出现验证码也阻挡不了它!

以上就是selenium鼠标键盘操作(ActionChains)的大部分功能以及破解亚马逊验证码的实现,有兴趣的读者朋友可以深入研究,将它利用到实际工作中。



以上就是本期的爬虫文章,谢谢阅读。


AMZ123跨境卖家导航旗下公众号【AMZ123跨境电商】深耕跨境行业,专注热点报道。
扫描右边二维码,关注后回复【加群】,加入优质卖家交流群~
目前30W+卖家关注我们
二维码
免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签问答
案例解读:Prime Day大促,宠物品牌雀巢普瑞纳做对了什么
亚马逊5月7-8日举办了亚马逊宠物日促销活动(Amazon Pet Day),为消费者提供宠物用品、玩具、服装、美容产品和配件的优惠折扣。这是亚马逊第三次举办Pet Day,特价品牌包括 Furbo、Frontline、Purina、Merrick、Blue Buffalo、Petmate、HoppScotch.bun、Jinx Pet Food、Halo Collar、Bundle x Joy、
盲盒界独角兽!Finding Unicorn独立站如何通过TikTok平台玩转潮玩市场?
盲盒在我国可谓是站在一个制高点,盲盒独特的特点给用户带来了无限的惊喜感,发展极为迅速。Z世代更为个性的消费观不仅推动了盲盒经济的发展,同时也引发了IP背后所隐藏的经济链条和各大潮玩品牌的互动。2015年我国潮玩产业规模已经达到63亿元,2022年我国潮玩行业市场规模上升至478亿元,复合年增长率超过30%。海外消费者与国内消费者一样,对能提供情绪价值的新颖事物充满好奇心,而这正符合盲盒的特点。今天
最新数据:近60%在线买家认为平台评价偏向好评
AMZ123获悉,5月15日,据外媒报道,印度社媒平台Local Circles的调查结果显示,在过去12个月中,近56%的印度在线购物者认为电商平台的网站和应用程序存在偏向正面积极评价的情况。据了解,鉴于在线交易的投诉量持续增长,Local Circles进行了一项全面的全国调查,以了解在线评论和评级自愿标准的有效性。该调查统计了印度超过344个地区的电商网站和应用程序用户的54000多份数据。
这些费用折扣优惠别错过!
费用支出是广大卖家最关心的话题之一。其实,eBay平台提供了许多政策和资源,帮助卖家在拓展业务范围、提高运营能力的同时,获得可观的费用折扣优惠。本期运营小课堂,便为大家介绍几个获得费用折扣优惠的妙招。许多卖家入驻eBay平台后,以个人卖家身份开展业务,这部分卖家只需要注册高于入门级的eBay店铺,就可以获得很大幅度的成交费优惠。我们可以通过下面这个例子来感受一下两者的区别。案例一卖家A以9,500
新案件汇总!两起国人原告外观专利维权发案!速看避雷!
带孔调料盖案件参数起诉时间:2024/5/15案件号:24-cv-3942原告品牌:带孔调料盖品牌方:Pingyang Wanwei E-commerce Co., Ltd起诉地:美国伊利诺伊州注册专利原告 Pingyang Wanwei E-commerce Co., Ltd 是国人卖家,拥有并经营一家亚马逊商店,专业销售各种厨具,如喷雾瓶、胡椒瓶等。案件涉及产品是一款常见的带孔塑料调料盖,其外
TikTok Shop对个体户开放?TikTok卖家靠一个爆品,年爆单2000万美元!
TikTok Shop卖家靠塑身泳衣爆单2000万美元!出品 | 电商123 作者 | 老柴TikTok塑身泳衣卖家1年卖了2000万美元电商123获悉,随着全球泳衣市场消费火爆,明年全球泳衣市场将增长到近300亿美元,也让最近一家TikTok Shop泳衣卖家凭借其打造的收腹紧身泳衣爆款单品在一年里拿下了20000万美元营收成绩。目前泳衣已经成为欧美女性夏日必备消耗品,且全球各类泳衣的消费需
离了个大谱?对华征收高关税后,美国又禁止26个中国卖家进入!
美国又禁止26个中国卖家进入美国市场!出品 | 电商123 作者 | 老柴对华高额关税将冲击美国经济电商123获悉,就在美国白宫5月14日宣布将对包括电动车、芯片、医疗产品在内的一系列中国商品征收新的关税,其中对中国进口电动车的加征的关税已调整到100%后,将经贸问题政治化的301关税受到了全球诟病,也将对接下来的美国经济复苏和降低通胀产生深远影响。对此,白宫国家经济委员会委员长表示,中国产业
挂钩到底被注册了多少个专利?这款双头挂钩加入维权队伍!
继旋转挂钩(24-cv-01841)、手袋挂钩(23-cv-2000)维权后,挂钩家族再添一员!01DOUBLE HOOK双头挂钩原告是我国东莞某贸易公司,主要在eBay和亚马逊等海外平台经营店铺,旗下有一款挂钩产品,可以给CPAP呼吸机用户支撑软管和收纳呼吸面罩。原告在5月16日向法院提交TRO禁令。案件信息:起诉时间:2024年5月15日案件号:24-cv-03956代理律所:Sherinia
“电脑遮光罩”在美国市场的(发明专利)侵权预警及规避办法668
在美国市场,以亚马逊美国站为例,下图所示产品为一种“电脑遮光罩”,用于类似笔记本电脑在室外使用时的光遮蔽和隐私遮挡:在美国市场有对应发明专利,其技术方案概述如下:本发明涉及用于电子设备屏幕的光遮罩及私密遮罩。用于电子设备屏幕的可折叠光遮罩及私密遮罩板特别适用于膝上型计算机、电子平板电脑和设备。光和私密遮罩由三个半刚性面板构成,其表面中集成了四个模制的塑料和橡胶夹。三个面板之间的区域形成灵活的铰链,
大量店铺销量砍半,卖家直呼淡季来了!
弹指间,2024年第二季度已经过半。 面对政策收紧、低价内卷、成本上涨等一系列持续发酵的运营难题,步入5月,亚马逊卖家们的跨境之路依旧走得磕磕绊绊。 根据以往的销售状况,因节日众多,消费者会在3月至5月的春季里购买礼物,这个时间段通常都被卖家们视作为亚马逊的销售高峰期。而对于5月这个拥有劳动节、母亲节等重要节日的月份,不少卖家更是报以在此期间能够迎来促销盛宴的期望。 但事与愿违的是,今年美国站卖家
亚马逊卖家1分钟爆单8600件?亚马逊群发"警告"邮件,有卖家已被封号!
超1万名亚马逊卖家营收破100万美元!出品 | 电商123 作者 | 老柴01亚马逊超1万名卖家销售额突破100万美元电商123获悉,近日亚马逊发布了一份《2023年小企业赋权报告》,该报告显示,2023年,美国独立卖家在亚马逊销售额突破45亿件,超1万卖家销售额超百万美元,平均每分钟8600件,平均年销售额超过25万美元。当然了,这些成绩的取得离不开亚马逊持续的资金、工具支持。▲图源网络,侵
出海月销百万美金!小众宠物品牌做出大爆单品
随着宠物经济的兴盛,智能养宠这条千亿赛道也愈发拥挤,大批新老玩家接连入场,你方唱罢我登场,好不热闹。听过智能喂猫、智能养狗,你听说过智能养鸟吗?FMI最新数据显示,2023年全球野鸟产品市场规模预计达73亿美元,预计2023~2033年复合年增长率为3.8%,而美国是全球鸟类产品最赚钱的市场之一,美国人对野生鸟类尤为痴迷,观鸟是美国人的第二大户外爱好。在市面上,传统的鸟类喂食器不仅卖不上高价,而且
亚马逊北美站低量库存费更新!这类产品将无需缴费
AMZ123获悉,近日,亚马逊北美站发布公告,宣布从5月15日开始,对低量库存费做出调整。此前,低量库存费自4月1日起生效,亚马逊将4月作为过渡期,向卖家返还在此期间收取的费用。根据最新公告,该过渡期将延长至5月14日。5月31日,卖家将收到4月1日至5月14日期间产生的所有低量库存费。此外,亚马逊针对低量库存费进行三项额外的更改:1.由于季节性产品等小批量产品的库存管理存在较高的不可预测性,5月
销量翻倍!亚马逊引流入口震撼上线!
4月,本该是卖家激情满满,大展拳脚的时候。但卖家们的经历却一波三折。近期,很多卖家反馈,遭遇单量滑坡,跌势仍在继续。看到这里卖家们可能会很焦虑。But,先别着急,亚马逊新推出了一项新功能Creator Connections,据了解,有望为卖家提高销量、增加曝光,并加速新品推广。那么,究竟是什么新功能呢?一起来看下吧!亚马逊推出新功能Creator Connections 卖家打开亚马逊的后台,在
亚马逊变体违规风暴升级,卖家赶紧自查!
正文众所周知,亚马逊亚马逊是一个重产品、轻店铺的平台,极其重视买家权益和购物体验。为了确保买家获得最佳服务,亚马逊制定了严格的卖家账户运营规则,这些规则必须遵守,绝不可逾越底线,否则卖家将面临店铺封禁的风险。最近,亚马逊平台掀起了一场针对变体违规行为的严厉打击行动,这股风暴的烈度之强,使得不少卖家都未能幸免。事实上,这并非亚马逊的突然行动,而是早有预兆的。从今年3月中旬开始,亚马逊就已经针对违规变
旺季备货遇到美国海关查验潮,怎么办?!
备受期待的亚马逊Primeday即将开启!作为一年一度的狂欢盛会,各位卖家朋友备好货了吗?在这紧锣密鼓的备战中,有消息称美国货物查验率突然暴涨,引发了大家的关注和讨论。莫慌,其实从4月开始,美国海关的检查频率一直就维持在较高水平。01什么原因导致美国海关查验率飙升?据了解,主要原因包括但不限于:1、模糊、不合规的货物描述引起了美国海关和边境保护局(CBP)的关注。2、频繁检出集装箱内藏有禁运物品和
《市场报告-隐形文胸(胸贴)》PDF下载
隐形文胸(又称粘性文胸,后简称胸贴),一种特殊设计的内衣,没有肩带和紧身设计,通过胶粘剂或胶水在胸部周围粘附,提供支撑和提升效果。材质主要有医用胶、连体服胶和硅胶三类
《2024年第1季度全球宏观经济季度报告》PDF下载
1季度,中国外部经济综合CEEM-PMMI指数季度低于荣枯线。美国经济继续扩张,美国经济继续扩张,欧洲经济双速复苏,日本经济运行大势稳定。印度经济继续强劲增长,巴西经济继续缓慢复苏,南非复苏态势疲弱,俄罗斯经济延续短期韧性。东盟六国和韩国金融市场呈现汇率相对较弱、股票市场整体表现较强的格局。
《2023年东南亚经贸简报-增长放缓旅游回升,汽车和资源贸易活跃》PDF下载
2023 年东南亚六国的宏观经济增速较上年有所放缓。菲律宾经济增长最为强劲,印度尼西亚制造业景气上升,越南消费表现强劲,马来西亚消费增长区域内第一,新加坡经济增长表现不错,泰国经济增长最为疲弱。
《跨境电商行业深度研究报告:短跑至长跑,跨境出海提速》PDF下载
海外头部跨境电商平台实力犹在,频频发力新兴市场。国际 B2C 跨境电商平台主要有 Amazon、eBay、Wish等。据Statista数据,在多位玩家集聚的美国市场,亚马逊以37.6%的绝对优势稳居市场份额第一,领先其他平台。
《2024全球可持续美妆的创新与革命》PDF下载
可持续美妆是企业积极担负社会责任的体现。品牌通过联合成立可持续联盟,构建评分系统等方式,在行业内推广各种可持续标准,共同努力构建一个更加绿色、透明的美妆世界。
《2023年全球应用广告变现趋势报告》PDF下载
从地区上来看,美国仍然是应用品类需要持续深挖的地区,持续上升的下载量、一路走高的 eCPM 为开发者提供源源不断的机会。尤其在工具与效率、小说与阅读品类上表现优异,不仅下载同比提升了10%,二者的广告收益也名列前茅。
《跨境境市场家居、园艺类目数据调研报告》PDF下载
全球家饰市场稳步增长(近5年4.9%的年复合增长率),预计2025年,全球规模将成长至1200亿美金;其中美国家饰市场占全球25%,欧洲占20%。
《亚马逊2022中国跨境电商产业集群白皮书》PDF下载
全球 2022 年经济增长放缓,部分品类消费需求减弱,国际化生产和贸易要素成本持续上升,压缩出口企业的利润空间;全球疫情对产业链供应链稳定带来一定影响,出口企业业绩承压。在当今世界经济环境充满不确定性的情况下,中国外贸出口和跨境电商行业展现出极强的韧性,保持着稳定发展态势。
AMZ123会员
「AMZ123会员」为出海者推出的一站式私享服务
跨境电商干货集结
跨境电商干货集结,是结合亚马逊跨境电商卖家交流群内大家在交流过程中最常遇到的问题,进行收集整理,汇总解答,将会持续更新大家当前最常遇见的问题。欢迎大家加入跨境电商干货集结卖家交流群一起探讨。
跨境学院
跨境电商大小事,尽在跨境学院。
跨境数据中心
聚合海量跨境数据,输出跨境研究智慧。
侃侃跨境那些事儿
不侃废话,挣钱要紧!
亿邦动力网
消除一切电商知识鸿沟,每日发布独家重磅新闻。
跨境科普达人
科普各种跨境小知识,科普那些你不知道的事...
跨境平台资讯
AMZ123旗下跨境电商平台新闻栏目,专注全球跨境电商平台热点事件,为广大卖家提供跨境电商平台最新动态、最热新闻。
品类交流群
跨境资料
官方社区
宠物品类交流群
加入
玩具品类交流群
加入
运动户外交流群
加入
立即扫码咨询
立即扫码咨询
立即咨询
官方微信群
官方客服

扫码添加,立即咨询

扫码加群
官方微信群
官方微信群

扫码添加,拉你进群

更多内容
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯