技能一 采集器原理及使用举例
第一种可以任意采集类目数据,前提给出类目链接(也就是类目id,这里称node id),
第二种:我想采集某个bestseller或某个关键词的链接,那么丢下链接即可
第三种:关键词等形式。比如我想采集iphone关键词下的数据,输入iphone 即可,。
大家很想知道类目数据是如何采集下来的?一个类目十几万到几十万asin数据不等,怎么采?这就是第一种采集方式,第一种很多人比较难理解,一个类目很多关键词产品,如何能采集完呢?那么就需要利用以下方法了。如果我想采集某个小类目,那么你只需要按照下面来:
例如某个类目nodeid的链接如下表示:www.amazon.com/b?node=1044510
nodeDI通用公式:=核心链接 制定数字
www.amazon.com/b?node= 1044510(后台下载ID数字),知道这个规律后即可用爬虫采集任意类目链接分类了,啊哈哈哈,那么你需要采集某个类目只需要去运营后台选择类目id编号,放到这个通用公司里面后把类似“www.amazon.com/b?node=1044510”放到创想这类采集器即可,理论上来说这个类目所有asin都会被采集出来。
这个工具有几年了,鉴于很多童鞋还在用爬虫辛苦爬,可能还不知道现成的软件,我下面给出个简单数据采集软件:淘宝搜创想,使用流程如下。此类软件由于ip会经常被屏蔽,所以下载效果一般是几百条asin数据采集完就会断掉,并不能全部采集完。晓生使用感受,啊哈哈哈。大家也可以用火车头、八爪鱼等采集器,后者有免费且相对简单,火车头就得学上十多个小时了。
顺便把修改链接采集关键词的方法也在这里说下:
技能2. 亚马孙搜索热词采集方式
比如:手动网址采集关键词:iphone7 c,我想把和这个词组有关的词都采集下来,那么只需要按照下列方式进行:
这样你需要一个个复制,那我们懒得复制和搜索情况下,,可以采用下面修改链接形式
https://completion.amazon.com/search/complete?method=completion&q=iphone c&search-alias=aps&client=amazon-search-ui-mobile&mkt=1&x=String&fb=1
采集结果显示有10个与搜索的基本结果一致:
completion = ["iphone 7 c",["iphone 7 case","iphone 7 charger","iphone 7 case for girls","iphone 7 case otterbox","iphone 7 clear case","iphone 7 charger and headphone jack","iphone 7 case wallet","iphone 7 car charger","iphone 7 car mount","iphone 7 charger case"],[{"nodes":[{"name":"Electronics","alias":"electronics"},{"name":"Cell Phones & Accessories","alias":"mobile"}]},{},{},{},{},{},{},{},{},{}],[],"193FH2Y38K88D"];String()
上周分享的文章,由于东栋童鞋担心大家vba不会取消了共享文件,所以晓生这里重新上传下文件供大家学习参考。
1.有说链接失效的,晓生这里给大家再次整理下:产品推荐hn童鞋的表格:链接:https://pan.baidu.com/s/1AIGJHkVJCK54ifMKO67kSQ
提取码:kyd6
复制这段内容后打开百度网盘手机App,操作更方便哦 2.东东童鞋关键词采集表-程序:链接:https://pan.baidu.com/s/1NfHWNlM9UBK99-SmnSd8gA
提取码:00dn
复制这段内容后打开百度网盘手机App,操作更方便哦 3.东栋童鞋的采集后台用的程序:参考用,链接:https://pan.baidu.com/s/1R05RaS7XGbDsOXTkjTPiKw
提取码:q9ug
复制这段内容后打开百度网盘手机App,操作更方便哦