本钟
14:32 · Mar 11, 2025 · Tue
关于互联网知识抓取。此前针对一些政策信息,在 n8n 里利用 css 选择器的方式,分类做了工作流。现在想想太低效了,而且正文内容也没有清洗干净。最近看了 firecrawl,以及利用小参数模型清洗数据的案例,计划改造下这套工作流。目的是在日常采集时多多利用模型和工具,完成数据清洗。【感想】以前囤信息,是觉着自己以后能再次查看,现在想想,囤太多其实看不完,还是囤些适合大模型的资料,让 agent 来完成信息查询、提取吧。
Home
Powered by
BroadcastChannel
&
Sepia