公众号爆文轻松抓取?看AI助力开发使用Cursor如何快速实现。

前段时间加入了由不会笑青年和纯洁的微笑两位大佬组建的知识星球AI俱乐部,大概是10天前,我发了一个关于用Cursor实现公众号爆文抓取的工具,并在AI俱乐部发表了一下,虽然只是个DEMO,没想到有些朋友一直希望能够拿到详细的过程分享,今天就给大家来详细讲解一下。

关于Cursor软件的使用,我稍微介绍一下,你只要打开聊天对话框,它就跟使用KIMI,或者是使用豆包一样,只需要输入文本指令,它就可以进行编程。

其实我最开始并不是想弄公众号爆文抓取工具,而是由于我在写公众号,想写一个辅助我写公众号的一个辅助工具,所以我一开始发出的指令是这样的:

帮我生成一个辅助写公众号的软件,包括10w+爆文查询推荐,模板定制等常规功能

可以看到下边有很多代码,都是自动进行输出,很快就形成了一个可视化界面,现在也没法看到原来的样子了,大概包括这么几个部分文章编辑,模板中心,爆文推荐,数据分析。

生成完成后,编辑器也会自动总结,完成了哪些功能

如果你不知道怎么运行,可以跟它对话,让他告诉你怎么运行

有些依赖外部的程序命令的,可能需要你手动执行,比如安装组件,或者是运行程序

我们运行起来后,它会提示我们打开浏览器,输入地址进行访问,我这里是http://localhost:8000

当时遇到了一个编辑器没显示的问题,就输入指令,继续要它完善

编辑器加载失败了,请检查代码和配置

修改完成之后,我想着弄个编辑器对我写作也没多少帮助,更多的需求,我希望从别人优秀的文章中,选择适合自己的文章再进行二创发表,所以又改变了一下想法,让他基于这个程序进行改造

将这个项目改一下,改成抓取爆款公众号文章的工具,并通过PYTHON实现抓取

数据功能,抓取阅读量在10万以上的公众号文章,主要抓取娱乐明星类的

在一顿代码输出之后,完成了修改,并提示要安装依赖,原来只有一个server.py,现在又多了一个crawler.py ,两个都需要运行

  1. 安装必要的Python包

pip install flask flask-cors requests

  1. 运行后端服务器

python crawler.py

  1. 运行前端服务器

python server.py

运行时,会出现一些警告信息,如下

PS E:\work\code\aipro\wechat-editor> python crawler.py 

  • Serving Flask app 'crawler' 

  • Debug mode: offWARNING: This is a development server. 

Do not use it in a production deployment. 

Use a production WSGI server instead.

我带着这些信息去问它

请告诉我这是什么意思,如果是BUG,请检查并修复

结果他的回答是:

这不是 BUG,这是 Flask 开发服务器的正常启动提示。

不过我们可以添加一些改进来让服务器更安全和稳定:

然后就是一顿代码修改的输出了。

改完之后,提示要安装组件waitress

pip install waitress

还要配置微信或者微信公众号相关的参数。 可我并不希望这么复杂,那怎么弄呢,请接着往下看。

为了更加方便,不用任何信息,于是我就以询问的语气去跟他互动

可以不用公众号ID和其他这些参数去帮我爬取数据吗

结果还真出乎我的意料,真的可以,于是它一顿代码输出,把程序改造了一番。

完成后,需要安装依赖

pip install beautifulsoup4

再重新启动一下前端服务器和后端服务器

这时候出现了一个提示“请检查公众号配置和Cookie是否正确”

我再问:

为什么还是提示 请检查公众号配置和Cookie是否正确

它根据我的问题,检查代码,并修复问题。 修复完成后,页面上点击按钮还是没有数据出来,于是写文字指令,让他把数据显示出来

列表中还是没有数据显示,暂时先设置抓取10条,

抓取到数据后,界面要能相识标题,时间等信息,

点击进入到相应的链接,看到文章内容

接收到指令后,它继续进行代码调整修改,很快修复完了。

但当我点击按钮时,发现还是没有数据,于是继续发指令

点击开始抓取,返回的都是暂无数据,请检查程序并修复

于是它根据我们给它的信息,分析问题出在哪里,再进行修复

最终这个爆文抓取工具的DEMO就形成了。效果见下图:

说实话,生成代码的时间是极短的。我写这篇文章用的时间,比生成代码的时间还多很多。

今天的分享就到这里了,如果您对Cursor编程,或者AI技术方面还存在诸多疑问,欢迎您把它们都写在评论区。

后续我还会分享更多的知识,点个“

在看

”,分享给更多爱学习的小伙伴们!