您现在的位置是:首页 > 采集器采集器

2022关关采集器5.0.0.1版本完美配合杰奇jieqi2.4-3.1以上版本支持分页采集

2021-12-29 09:23:57采集器128人已围观

简介重要提示

由于本采集器为花费重金购买而得,所以此版本为售卖版本,并会在文章下方提供3.5版本免费下载!

淘宝售卖地址:https://item.taobao.com/item.htm?spm=2013.1.w4023-969

重要提示

由于本采集器为花费重金购买而得,所以此版本为售卖版本,并会在文章下方提供3.5版本免费下载!

淘宝售卖地址:https://item.taobao.com/item.htm?spm=2013.1.w4023-9693410265.7.519413e4pj1251&id=655839333587

提示:可下载的3.5版本的采集器可以采集增加新文章,在文章更新时有BUG出现。



     此版经测试在杰奇1.7、1.8、2.X,3.X版本中表现良好,多开,多任务不卡线程,任务休眠期间会自动释放内存,采集速度较佳,较流畅!

     注意:虽然支持全线的采集入库,测试不支持1.7生成html,现已全线放弃2.4以下版本的功能维护
     版本定格拉

    2019年10月7日
     1、国庆假最后一天修正杰奇2.4生成HTML的一处BUG
     2、杰奇2.4目录页生成时的字数调用标签的增加
     3、手动模式下删除本地章节的一处细节调整

=======================以上开始只是BUG的修正,功能无增加=======================

    2019年10月4日
     里程碑的更新,支持章节目录的分页采集,从此可以告别外挂的痛苦,SO,版本号定格V5.0,以后专注研究PHP周边及大健康
     1、PubIndexUrlPagekey:获取小说目录页的分页编码的正则
     2、PubIndexUrlPage:分页目录组合URL
     3、开启目录分页采集会减低生产效率,不想降低生产效率该如何解决?简单,以上两个规则空着,自己外挂即可!
     4、采集器写到这里,该有的不该有的都写了,那么就此定格版,够用就好!

          青山不改,绿水长流,有缘江湖再见或者再也不见!
          最后祝大家流量一天十翻,10天过百万,100天收购李彦宏!

    2019/10/03
     1、更改自动采集模式下索引的对比方式,不管是全本还是连载均会对比!
     2、更改10月2日的规则“PubChapter_GetSkip”跳过章节开头几个章节数的判断方式,可以留空表示不跳过,如需要跳过请按实际填写对应数字,如:9
    2019/10/02
     1、增加规则中加入跳过前几章不采,不跳过请写0,不能为空,切记切记!(此判断已经于2019年10月3日更新判断,可以留空)
    2019/10/01
     1、首先祝大家节日快乐,祖国繁荣昌盛!
     2、修正分页采集,采集多页更快乐!具体格式:
           PubContentPageUrl为分页URL,如:hrrps://www.abcd.com/book/{NovelKey/1000}/{NovelKey}/{NovelPubKey}_{Page}.html
           PubContentPageKey分页结束的标识,如:下一章、或者 >下一章<
    2019/09/28
     1、注意请安装.NET4.5以上!
     2、支持3.0的原生TXT、封面、图片章节等附件路径,当然也可以自定义!
     3、3.0读取的的sort.php及config.php文件在"/cms/configs/article/"文件夹里,sort.php写法同2.4一样,只是统一顺序问题,内容是一样,注意:CODE的值不能为空!
     4、3.0在"系统设置=>本地网站目录”时,请指向同public和CMS文件夹同级目录即可!
     5、3.0的TXT文件默认放在 "storage/data"下属的子目录中,封面、HTML静态文件、章节附件默认放在“storage/files"下属的子目录中!
    2019/09/27
     1、去掉关闭时可选最下化到右下角功能!
     2、修正配置文件引起的“索引超出了数组界限”的BUG,这是一个很讨厌的BUG,真的很讨厌!
     3、修正1.8入库时因个别字段没有不能采集的BUG!
    2019/09/25
     1、修正几处BUG!
    2019/09/24
     1、重新启用"清理无用html页面"和”清理无用txt文本文件“,在标准模式->高级修复里开启或关闭!
     2、修正多处读取和写入TXT及HTML时因编码不正确导致的乱码BUG!
    2019/09/23
     1、无聊弄了个最小化到右下角的功能,点关闭按钮会提示是最小化到右下角还是退出采集器,一是为了避免误点关闭,二是为可以节省任务栏,点右下角图标会自动还原窗口,就像QQ一样的可爱,可直接在状态栏双击书本图标快速打开和最小化窗口!
    2019/09/21
     1、自动采集索引对比优化,开启自动修复后,连载状态的内容改变任意章节均会自动修正,不再全部索引遍历,只要章节大于1的任意位置,对比不上就直接开始替换!
    2019/09/16
     1、修正手动模式下时间显示不正确的BUG!
     2、调整部分页面布局,适应自动缩放!
    2019/09/08
     1、修正杰奇1.7版只能入库新书不能更新已有小说的BUG!
     2、修正替换章节文本编码不正确的BUG!
    2019/09/07
     1、修正杰奇1.7版入库时字数不正确BUG!
     2、杰奇1.7自动采集生成OPF时进行格式化处理,更易读!
    2019/09/05
     1、修正杰奇1.7版保存TXT和OPF时依旧为UTF-8编码问题
     2、修正杰奇1.7书名拼音问题,采用同1.8以上版本相同的拼音字段articlecode,请在设置里生成拼音化,否则将不能采集
    2019/09/01
     1、说好的不更新了,手贱更新一下
     2、增加网站编码定义,可通吃GBK及UTF8
     3、更改章节自动修复的索引对比方式,理论上是更友好,更高效
     4、去掉部分无用功能
     5、若干小BUG修正
     6、增加生成HTML的内链功能
    2019/08/06
     1、.net必须为V4.0以上,不是4.0请自行安装X64,不支持WINDOWS2008以下版本
     2、修复若干小BUG,当然还是有BUG
     3、支持jieqiv1.X-3.X版本,当然是UTF8(UTF8,UTF8,UTF8,说三遍)包括TXT及OPF均已生成为UTF8,已抛弃GBK,系统只测试了V2.3及2.4
     4、MYSQL组件的更新,是为了支持MYSQL编码集utf8mb4
     5、原生杰奇标签更友好
     6、此版为终版,不再更新不再修复BUG,至于功能也不增加了
     7、JieQiv2.4开始字数标签为{?$words?},及相关的有多处改动标签,自行查手册
     8、工具只限个别内部流通
     9、建议配合开源杰奇2.4UTF8版使用,配上PHP7.3+OPCache+MemCache,感觉人生从此达到了巅峰
     ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
     由于1.8以后版本的目录页判断比较多没有一一判断所以用的时候把代码按以下格式来写(仅供参考,自行测试)
        {?section name=i loop=$chapterrows?}{?if $chapterrows[i].chaptertype > 0?}{?if $i['order'] > 1?}
        </UL>
        </DIV>{?/if?}
        <DIV class=dirtitone><H2>{?$chapterrows[i].chaptername?}</H2></div>{?if $i['order'] < $i['count']?}
        <DIV class="clearfix dirconone">
        <UL>{?/if?}{?else?}{?if $i['order'] == 1?}
        <DIV class="clearfix dirconone">
        <UL>{?/if?}
        <li class="chapter"><a href="{?$chapterrows[i].url_chapter?}" title="{?$chapterrows[i].lastupdate|date:'Y-m-d H:i'?}更新,共{?$chapterrows[i].size_c?}字">{?$chapterrows[i].chaptername?}</a></li>{?if $i['order'] == $i['count']?}
        </UL>
        </DIV>{?/if?}{?/if?}
        {?/section?} 

以下为采集器下载地址
关关采集杰奇3.5通用版.rar
d6ab178af4002f29be44c6cfafc8ca87.rar (4.97 MB)

Tags: 关关采集器5.0.0.1版本、关关采集器5.X通用版  

很赞哦! ()

留言与评论 (共有 条评论)
验证码: