班泊Bangboom跨境:跨境电商市场分析
上篇文章发布后,很多朋友在问能不能爬关键词,话不多说,立马安排。
不要在意文章格式,程序员不知道搞花里胡哨的文章样式。记得转发获得更多规则代码!
先上上篇文章演示的规则代码。
#获取指定精确关键词的竞品数据(复制以下代码导入到web scraper中即可)
{
"_id":"get_others_by_kw",
"startUrl":[
"https://www.amazon.com/s?k=dinosaur+lampeez&ref=nb_sb_noss&p=[1-2]"
],
"selectors":[
{
"id":"asin",
"type":"SelectorElementAttribute",
"parentSelectors":[
"container"
],
"selector":"_parent_",
"multiple":false,
"extractAttribute":"data-asin",
"delay":0
},
{
"id":"image",
"type":"SelectorImage",
"parentSelectors":[
"container"
],
"selector":"img.s-image",
"multiple":false,
"delay":0
},
{
"id":"container",
"type":"SelectorElement",
"parentSelectors":[
"_root"
],
"selector":"div[data-asin^=B][data-index]:nth-of-type(n)",
"multiple":true,
"delay":0
},
{
"id":"title",
"type":"SelectorText",
"parentSelectors":[
"container"
],
"selector":"h2",
"multiple":false,
"regex":"",
"delay":0
},
{
"id":"star",
"type":"SelectorText",
"parentSelectors":[
"container"
],
"selector":"i.a-icon-star-small",
"multiple":false,
"regex":".{3}",
"delay":0
},
{
"id":"review",
"type":"SelectorText",
"parentSelectors":[
"container"
],
"selector":"a.a-link-normal span.a-size-base",
"multiple":false,
"regex":"",
"delay":0
},
{
"id":"price",
"type":"SelectorText",
"parentSelectors":[
"container"
],
"selector":"[data-a-size='l'] span[aria-hidden]",
"multiple":false,
"regex":"",
"delay":0
},
{
"id":"likeword",
"type":"SelectorLink",
"parentSelectors":[
"container"
],
"selector":".a-size-mini a",
"multiple":false,
"delay":0
}
]
}
拿到亚马逊对产品的识别词
词频分析挑出最重要的关键词
一、测试平台搜索词是否具备分析价值
1. 首先说个结论亚马逊对产品的定位词很精准,绝对不可错过分析,这里可以简单测试,随便找个产品后,拿到平台识别词,通过平台识别词进行关键词搜索,若搜出来都是相同或相似产品则表明词有用。显示位置如下图所示。
2. 拿到识别词搜索结果检验如下,定位到首页搜索结果最底端显示的依旧是同类产品,表明这个位置的平台识别词具备分析价值。
3. 既然确定有用那就直接拿。挨个界面一个个拿很费时间?教你个简单方法,几秒内爬取几百条竞品平台识别词。
通过上述代码,按昨天方式,直接爬取表格,爬出来之后是下面这样的:
通过上图可以发现,平台识别词是拿到了,但是并不好分析,好人做到底,简单表格正则表达式处理方式也教个大家。
拆到干净数据,主要做5步
1. 替换 %2F 为 / ------> 为了兼容广告超链接转义问题
2. 替换 *&url=/ 为空 ------> 为了划分广告超链接中的识别词
3. 替换 /dp/* 为空 ------> 拆分正常链接
4. 替换 https://www.amazon.com 为空 ---> 其他站点对应替换
5. 替换 - 为 空格(记住是空格不是空)
不会换的参考下图,Excel软件点击编辑再点切换
通过上述五步操作处理后就是如下图的数据,干干净净,清清楚楚,随你玩。
比如放到词频工具中分析哪些词或词组用的比较多,如下图: