IOSS, OSS, VAT税号, EORI 到底是什么?
快速获取独立站产品所有链接(shopify为主)
原理:站点地图sitemap
方式: 合理利用sitemap网站地图获取
获得:网站每个产品的链接
站点地图的概念
1.什么是 XML 站点地图?
XML 站点地图是为搜索引擎提供的网站 URL 列表。它是用sitemaps.org概述的代码格式编写的,他们是 XML 站点地图的权威。
2.站点地图能做什么?
Sitemap站点地图可以将URL 提交给搜索引擎,可以帮助搜索引擎以更快的方式查找和索引新网站或更新的网页。
第一步,获取网站地图
sitemap格式一般是这三种:
xxxx.com/sitemap
xxxx.com/sitemap.xml(shopify通用格式)
xxxx.com/sitemap_index.xml
如果这3种都不可以的话,可以谷歌搜索sitemap checkup等
举例用shopify网站
随便找个网站 https://www.anitaherbert.com/
加入shopify通用后缀https://www.anitaherbert.com/sitemap.xml
得到
复制连接格式为<loc>https://www.anitaherbert.com/sitemap_products_1.xml?from=3683154657328&to=6925692764347</loc>
第二步,提取产品链接列表
格式为xxxx.com/sitemap_products_1.xml?from=数字&to数字
https://www.anitaherbert.com/sitemap_products_1.xml?from=3683154657328&to=6925692764347
https://www.anitaherbert.com/es/sitemap_products_1.xml?from=3683154657328&to=6925692764347
https://www.anitaherbert.com/hu/sitemap_products_1.xml?from=3683154657328&to=6925692764347
依次打开,得到数据
第三步,提纯
我们需要提纯,提出产品链接,可以用”sitemap链接提取小工具”或者Ctrl+A,Ctrl+C, Ctrl+V 复制进Excel文档筛选提纯
小工具可以谷歌搜”sitemap链接提取”
我用的是这个https://tooltt.com/sitemap2url/
全部数据复制粘贴进去工具中
按"提取URL"得出
我们就可以获得此网站所有的产品链接.
把链接复制到表格中,可以进行更多的研究.
例如爬销量,价格,标题,描述,都需要产品页面来驱动