火车采集器3.2版 SP3更新【最后更新:20071101】 | ||
---|---|---|
授权: | 免费版 | |
更新: | 2010-04-19 15:11:57 | |
语言: | 简体中文 | |
平台: | Win2000/WinXP/Win2003/Win7 | |
大小: | 未知 | |
下载: | 0 | |
简介: | 本次更新又增加了不少,修改了了许多存在的问题,重新开帖发布 火车采集器配备的全站HTML生成器工具还待进行一下关键词和模板方面的优化,稍候几天发布 3.2 SP3版更新内容[2007-11-01] 增加了对数据库发布设置的保存,针对任务可以和Web发布设置一样选择不同的数据库发布设置 增加了全局敏感词过滤和近义词替换功能 ----[该功能集成在标准版内] 增加了对非默认端口导出到Mysql和mssql的支持 增加了对单任务设置采集、发布线程数,间隔时间,及发布到哪定义为成功的设置 增加了强力时间格式转化功能,WEB发布模块增加[时间转换]标签和[系统时间戳]标签,可以将采集过的时间重新编排为任意格式或时间戳格式 增加了设置单标签是否循环匹配的功能 增加了压缩任务ACCESS数据库的功能 增加了迅雷&FlashGet加密解密工具 增加了软件对迅雷&FlashGet地址的解密并自动下载文件的功能 ------[该功能集成在个人,标准版内] 增加了系统对Form表单,li,ul,frame,hr,h1-7等html标签的排除,修正了无法排除Script标签的功能 增加了对每个标签可设置是否循环匹配的功能,结合添加为新记录可针对任何标签添加出多条记录 增加了对取出的内容中第一张图为缩略图并下载的功能 增加了起始地址向导添加内使用正则提取网址的功能 增加了任务列表向任务运行显示区拖曳后开始采集的小功能 更新了自动更新的设置方式,SP3中可设置按每天,每个星期中的那天,单次运行,在某个时间段内间隔多少分钟运行一次 ---- [该功能集成在个人,标准版内] 更新了手动分页的设置方式,可设置任意多参数和使用参数组合出分页网址 修正了在包含#符号的非锚点网址采集地址出错的问题 修正了在包含../../等上一级超过域名最顶级后地址出错的问题 修正了WEB在线发布模块编辑器内多次加载出现随机值列表框内值混乱的问题 修正了在下载文件时无法使用代理服务器的问题 修正了对部分网站采集无法得到源代码的情况 修正了下载缩略图时内容内缩略图地址无法对应的问题 修正了保存为TXT文件时没有保存缩略图的问题 修正了没有可采集网址和可发布的内容任务无法自动停止的问题 修正了带中文的网址在测试时可以采集但正式采集时无法采集到下级网址的问题 修正了中文网址采集时导入本地任务数据库[程序目录/data/任务名/SpiderResult.mdb]错误的问题 修正了导入文本网址时文本为空时预览报错的问题 更新了编辑任务时ESC退出的不合理设计,更改显示隐藏热键为Ctrl+F8 |
下载地址
该版本已停止下载