大米CMS官网论坛,大米站长联盟,大米站长之家,大米开发者社区

 找回密码
 注册大米会员

QQ登录

只需一步,快速开始

查看: 12179|回复: 5
打印 上一主题 下一主题

大米CMS数据采集简明教程

[复制链接]

501

主题

778

帖子

7664

积分

超级版主

Rank: 8Rank: 8

积分
7664

授权用户

跳转到指定楼层
楼主
发表于 2014-9-30 09:23:44 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 追影 于 2014-9-30 09:30 编辑

(1)指定列表页 列表页可以是单页也 可以是一个包括起止的url 比如
http://www.dangdaitushu.com/news-dongtai/page_{2,6}.html 表示采集从第2到6页
http://www.dangdaitushu.com/news-dongtai/page_3.html表示只采集第3页
(2)指定详细页的url 不包括HTTP 这是指从客户端源代码中取出的详细页相对URL 可以用firebug或goole浏览器找到该地址,该URL中可以指定取数字或*
比如 /news-dongtai/{*}.html 或 /news-dongtai/{(\d)+}.html




(3)匹配字段规章
比如内容匹配
<div class="main_content">{content}</div> {content}表示提取到的东西给content字段
支持增加字段匹配


(4)完整的表单实例:




(5)采集结果保存SQL先,也可以直接入库


大米CMS的采集就这么简单,赶不上大型的CMS 采集那么复杂,见谅!


分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 分享分享
回复

使用道具 举报

2

主题

8

帖子

70

积分

新手上路

Rank: 1

积分
70
沙发
发表于 2014-11-25 14:25:33 | 只看该作者
采集功能太简单了,采不太成功!希望加强
回复 支持 反对

使用道具 举报

2

主题

8

帖子

70

积分

新手上路

Rank: 1

积分
70
板凳
发表于 2014-11-25 14:30:16 | 只看该作者
还有希望写的采集规则能保存啊!还有能自动去除重复的文章,采过的不会在采,
回复 支持 反对

使用道具 举报

501

主题

778

帖子

7664

积分

超级版主

Rank: 8Rank: 8

积分
7664

授权用户

地板
 楼主| 发表于 2014-11-25 15:44:17 | 只看该作者
这个你自己看着扩展吧 大米CMS本来就是中小CMS
回复 支持 反对

使用道具 举报

0

主题

1

帖子

4

积分

新手上路

Rank: 1

积分
4
5#
发表于 2017-2-23 17:39:32 | 只看该作者
我还是没有看懂,弄一下午还是没有弄出来,还是有几个问题
前两个网址我明白,
标题和内容那块有点不明白
我是填列表模板还是填内容模板的标签

内容页的标题
<h1 class="gg">[!--title--]</h1>
应该填什么
内容<td  width="863px">[!--newstext--]</td>
应该填什么
回复 支持 反对

使用道具 举报

501

主题

778

帖子

7664

积分

超级版主

Rank: 8Rank: 8

积分
7664

授权用户

6#
 楼主| 发表于 2017-2-23 18:40:39 | 只看该作者
这个是老版本的 新版支持像jquery样的选择器 不明白授权用户直接加我!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册大米会员

本版积分规则

QQ|小黑屋|大米CMS社区 ( 蜀ICP备11002200号-2广告联系:广告联系 

Powered by 大米CMS

© 2010-2020 大米CMS Inc.

快速回复 返回顶部 返回列表