AutomationAnywhere(AA)实现网页抓取
由于AA官方信息指明,在2021年9月已经完全停止之前版本的销售,需要客户尽快迁移到A360产品中,因为2022年9月之后可能就不会售后之前的版本了。所以这里介绍一下A360云版本的使用
1. 打开指定网址
Browser – Open
1.1 打开指定网页使用browser下的open组件
1.2 选择New window
1.3 选择指定的浏览器类型Broswer(如果使用的是Chrome、Firefox需要下载指定的插件才可以进行网页抓取)
1.4 在Link to open处填写需要打开的网址
2. 窗口最大化
Window – Maximize
2.1 窗口最大化是指将网页打开之后会默认网页大小,若想要将浏览器窗口最大化可以使用window下的Maximize组件,当然不设置窗口最大化也不会影响后面的操作
2.2 点击刷新按钮使得识别到当前打开的所有窗口
2.3 选择需要最大化的窗口
3. 网页抓取
Recorder – Capture
3.1 click点击事件
3.1.1 选择recorder下的capture组件进行网页抓取工作
3.1.2 选择Application首先点击刷新按钮更新一下当前的所有窗口并选择需要操作的网页窗口
3.1.3 选择Recapture Object按钮,会自动跳转到上面选择的网页上,选择需要操作的地方,等待捕获完成(这里示例选择了hao123)
3.1.4 选择对该对象的操作Action to take on object,这里选择了单击click,当然根据需要也可以选择left click、right click、double click
3.2 获取文本
3.2.1 若想要获取元素的文本内容,可以选择get property,需要填写property name为HTML InnerText(注意property name是区分大小写的)
3.2.2 获取文本需要将结果赋值给变量,在Save the outcome to a variable处更改
3.3 输入框
3.3.1 若想要在输入框输入内容,则选择set text,之后在Keystrokes处输入要输入的内容,当然可以选择提前定义好的变量
3.4 获取表格
3.4.1 当然,也可以直接抓取网页上的一个表格信息,抓取之后选择Get table
3.4.2 将结果赋值给一个类型为Table的变量,在Save the outcome to a variable处更改
3.5 获取超链接地址
3.5.1 若想要获取元素的文本内容,可以选择get property,需要填写property name为HTML Href(注意property name是区分大小写的)
3.5.2 获取文本需要将结果赋值给变量,在Save the outcome to a variable处更改
3.5.3 关于获取网页上某一元素的其他信息时,若抓取元素之后不清楚在property name填写什么内容,可以参考该元素的Object properties内容