大米CMS官网论坛,大米站长联盟,大米站长之家,大米开发者社区

标题: 大米CMS数据采集简明教程 [打印本页]

作者: 追影    时间: 2014-9-30 09:23
标题: 大米CMS数据采集简明教程
本帖最后由 追影 于 2014-9-30 09:30 编辑

(1)指定列表页 列表页可以是单页也 可以是一个包括起止的url 比如
http://www.dangdaitushu.com/news-dongtai/page_{2,6}.html 表示采集从第2到6页
http://www.dangdaitushu.com/news-dongtai/page_3.html表示只采集第3页
(2)指定详细页的url 不包括HTTP 这是指从客户端源代码中取出的详细页相对URL 可以用firebug或goole浏览器找到该地址,该URL中可以指定取数字或*
比如 /news-dongtai/{*}.html 或 /news-dongtai/{(\d)+}.html




(3)匹配字段规章
比如内容匹配
<div class="main_content">{content}</div> {content}表示提取到的东西给content字段
支持增加字段匹配


(4)完整的表单实例:




(5)采集结果保存SQL先,也可以直接入库


大米CMS的采集就这么简单,赶不上大型的CMS 采集那么复杂,见谅!



作者: tpnn80    时间: 2014-11-25 14:25
采集功能太简单了,采不太成功!希望加强
作者: tpnn80    时间: 2014-11-25 14:30
还有希望写的采集规则能保存啊!还有能自动去除重复的文章,采过的不会在采,
作者: 追影    时间: 2014-11-25 15:44
这个你自己看着扩展吧 大米CMS本来就是中小CMS
作者: ziyoubinglu    时间: 2017-2-23 17:39
我还是没有看懂,弄一下午还是没有弄出来,还是有几个问题
前两个网址我明白,
标题和内容那块有点不明白
我是填列表模板还是填内容模板的标签

内容页的标题
<h1 class="gg">[!--title--]</h1>
应该填什么
内容<td  width="863px">[!--newstext--]</td>
应该填什么

作者: 追影    时间: 2017-2-23 18:40
这个是老版本的 新版支持像jquery样的选择器 不明白授权用户直接加我!




欢迎光临 大米CMS官网论坛,大米站长联盟,大米站长之家,大米开发者社区 (https://www.damicms.com/bbs/) Powered by Discuz! X3.1