用后羿采集器来进行WordPress的批量采集与发布

WordPress是我用的比较多的一个程序。无论是搭建企业网站,个人博客,或者一些小站点。使用起来都非常的顺手,而且最主要的是因为用的人比较多,所以各类插件市场也是非常繁荣,基本上只有你想不到,没有他做不到的,

在漫长的使用过程中我还是总结出了一套自己的套路。特别是内容的填充方面,可以说是得心应手,

因为我搭建的网站类型比较多,基本上各种类型都涉猎过,无论是中文还是英文的,但是建站初期最大的问题永远是内容不足,纯手工的新建太耗费时间和精力了,所以采集成了大家最快填充内容的方法,虽然有点不道德,但是也是没办法。

目前WordPress也有很多采集插件,网上也有很多采集软件,但是对我来说有两个问题,

第一:要钱 太贵 买不起 穷

第二: 能力不够。使用起来 不顺手 最重要的是 规则不会写。

我自创的这个方法可以说完全的解决了这两个问题,

但是缺点也很明显,耗服务器资源,如果是自己的服务器倒还是很好解决,如果是购买的一些比如空间对资源限制比较厉害的可能会导致发布失败,但是可以通过降低导入的速度和效率 把速度降下来来解决这个问题。。

但是总的来说得心应手,所以一直使用这个办法多年,今天把它放出来,希望大家多多参考。。有什么问题 可以在后面留言!

前期我们需要准备的东西如下:

一、WordPress 安装好是必须的。

二、重要的是一个插件。WP All Import 该插件要支持Excel导入到文章 商品等各种类型,非常好用。正版要付费。但是有免费版。以后发出来,本篇文章主要是说方法。

1.jpg

三、一个得心应手的采集器,支持采集的内容导出到Excel TXT等格式文件。

我目前使用的比较满意的采集器有 八爪鱼和 后羿采集器, 其中后羿采集器我用的比较多。

都是直接挂官网。没有挂推广链接 所以不存在软文嫌疑。。

八爪鱼官网: https://www.bazhuayu.com/

后羿采集器: http://www.houyicaiji.com/

接下来的内容我将以后羿采集器为蓝本来介绍,因为这个软件我用的比较顺手。这是我最近采集的内容,

我将以 AMZ123 采集的 这1666篇文章来做说明。那至于采集的过程我会开新文章来说。大家不要着急。本篇主要给大家说我是如何实现这个方法的。

特别说明:我不会提供任何平台的采集规则给你们,也不提供任何平台的采集规则教程意见建议,建议自己百度谷歌,或者找采集软件官方。同时也不建议你们采集人家的数据。

2.png

我采集的 AMZ123的文章是 https://www.amz123.com/forum-10.htm 这个目录下所有的文章。

3.jpg

这里我已经采集完成了。 将内容导出到 文件导出即可。

4.jpg

其实能导出的格式真的非常多。 我一般都是 导出到Excel格式方便我在本机进行二次编辑。

其实我还测试过导出到 MYSQL等数据库。都是没问题。我作为演示还是导出到 EXCEL吧。这个是最简单的了。5.jpg

用Excel打开。看字段3 是详情页内容。 这里 吐槽下自己给自己挖的坑。

因为采集的时候 没搞好。导致采集了大量的广告。所以 没办法只好用EXCEL 批量修改。不过好在 广告的内容都一样。而且有定位的字段,所以批量替换就完事了。工作量不大。三下五除二搞定。

6.png7.jpg

将修改好的内容 保存备用即可。

这里我特别说下。。

一千多条数据 不算多。但是如果直接 EXCEL打开 超级卡。

所以 最好的办法其实还是 直接导出到 MYSQL,用Navicat Premium 进行批量编辑。

这个是后面的教程。 现在 我们 简单来说。数据已经修改完成。 然后登录后台导入。

上传 刚刚 修改好的EXCEL 文件

8.jpg

选择类型为文章。如果是其它类型 自己选择就可以了。如果你想看的特别仔细 请关注我。我会对这几个软件进行单独 特别详细的介绍和说明。

9.jpg

软件一步步的往下走。需要很多地方进行设置。 这里我也不说。就直接到最后一步 导入:::

如果不涉及到 附件上传。只是文章的导入。那速度是相当快的。。。

10.jpg

11.jpg

12.jpg

非常快 导入已经完成了。。我们去后台 看看导入的文章.

但是这里面还涉及到非常多的细节。比如类目 主图 标签 发布者 等等。其实都是可以在发布的时候自定义的。但是 因为这次只是粗略的告诉大家 给大家做个演示 所以就不一一说明了。 看不懂的 后面留言吧!

13.jpg

14.jpg

因为文章的采集是在自己电脑进行的。所以根本不耗费服务器资源。采集的速度是根据本机网络和性能决定的,如果你嫌速度慢。掏钱给软件官方。他们有服务器云采集。几百万条数据我相信都是 没问题的。

采集的内容后期要自己进行二次编辑。比如 图片连接 外链等等 细节还是需要进行编辑。

在本机编辑比在 服务器编辑的速度快多了。 编辑好之后再用这个插件导入。

如果你有足够技术 可以直接 导入到WordPress的数据库也是可以的。

反正方法就是这样 师傅领进门 修行靠个人。。 希望多多学习 不明白的大家多多交流吧!!

本文作者: 老张
本文链接: https://laozhang.me/324.html
版权说明: 本站文章很多都来自互联网,如果侵犯了您的版权请告诉我们,我们会尽快删除,如果您喜欢本文想要转载请保留本站链接,感谢您的支持!
THE END
分享
二维码
< <上一篇
下一篇>>