浏览器之家


火车采集器(LocoySpider) 2010 Sp1

火车采集器 (LocoySpider)是一款专业的功效强盛的网络数据/信息发掘软件,通过机动的配置,您可以很轻松的从网页上抓取文字、图片、文件等任何资源。程序支撑远程下载图片文件,支撑网站登陆后的信息采集,支撑探测文件真实地址,支撑代理,支撑防盗链的采集,支撑采集数据直接入库和模仿人手工发布等许多功效特点。火车采集器支撑从任何类型的网站采集获取您所需要的信息,如各种消息类网站、论坛、电子商务网站、求职招聘网站等。同时具有强盛的网站登录采集、多页和分页的采集、网站跨层采集、POST采集、脚本页面采集、动态页面采集等高级采集功效。强盛的php和c#插件支撑,让您可以通过二次开发实现您所想要的任何更强盛的功效。 火车采集器特有功效:
1、支撑所有网站编码:完善支撑采集所有编码格式的网页,程序还可以主动辨认网页编码。
2、多种发布方法:支撑目前所有主流和非主流的CMS,BBS等网站程序,通过系统的发布模块能实现采集器和网站程序间的完善联合。
3、全主动:无人值守工作,配置好程序后,程序将根据您的设置主动运行,完整无需人工干涉。
4、本地编辑:本地可视化编辑已采集的数据。
5、采集测试:这是其它任何同类采集软件所不能比的,程序支撑直接查看采集成果并测试发布。
6、管理方便:应用站点+任务方法管理采集节点,任务支撑批量操作,再多的数据管理也很轻松。
利用范畴
垂直搜索(或称为专业搜索)服务
信息汇聚和门户服务
企业网信息汇聚
商业情报采集
论坛或博客迁移
智能信息代理
个人信息检索
信息发掘
实用群体
1、公司团体
2、政府机关与部队
3、门户网站
4、消息媒体
5、广告与市场研究机构
6、金融机构
7、电信移动联通
8、科学与技巧研究单位
9、网站站长
10、电子商务(如淘宝店长等)
11、其他

2010-04-25主动升级更新已解决以下问题——————
1.修复了采集内容或网址时出错导致程序退出的问题.
2.下载文件并下载时文件地址错误导致程序退出的问题.
3.应用插件时测试发布应用的数据不是插件处理后的数据的bug.
4.修正了一个智能提取时SY标签提取错误的问题.
5.列表页标签部分情况下提示重复的bug.
6.在分词或摘要时不存在某个标签时可能出错的bug.
7.在采集时供给了更多的细节显示.更方便用户查看进度.
8.探测文件并下载给加了不区分大小写功效.
9.修复倒序发布时部分次序不对的问题.

2010-05-06主动升级更新已解决以下问题——————
10.MSsql会呈现 所唯一索引之类的问题.
11.内置浏览器访问某些网站出错的问题.
12.网址库过大时提示内存不足的问题.
13.全局设置[换行]不起作用的问题.
14.添加全局调换后部分情况下调换不起作用的问题.
15.应用主动更新时,如果设置错误的时间导致程序无法运行的问题.
16.以SqlServer做数据库时网址重复检测失败的bug.
17.导入导出时增加了文件夹的设置.
18.更新了加密程序,支撑更高版本.net.
19.修复了以MySql做数据库时数据库错误解导致程序退出的bug.
20.修复了入数据库时,大小写错误引起入库失败的bug.

2010-05-11主动升级更新已解决以下问题——————
21.mysql中同时添加多个字段提示错误的bug.
22.修正了一个应用自定义网址过滤时不得包含不起作用的bug.
23.加强了检测文件并下载的功效.
24.自定义中时间网址生成的一个bug.
25.更新Sqlite驱动到最新版.
26.编辑任务修正和最后采集时间没有显示的bug.

2010-05-13主动升级更新已解决以下问题——————

27.修复了删除有索引的标签时错误的bug.
28.修复了测试采网址时显示的一个错误.
29.修复了当网址链接应用basehref时如果basehref不是根目录网址获取错误的bug.
30.增加了备份用户配置文件功效.
31.修复了删除有索引的标签时错误的bug.
32.修复了测试采网址时显示的一个错误.
33.修复了当网址链接应用basehref时如果basehref不是根目录网址获取错误的bug.
34.增加了备份用户配置文件功效.
35.修复了mysql中同时添加多个字段提示错误的bug.
36.修正了一个应用自定义网址过滤时不得包含不起作用的bug.
37.加强了检测文件并下载的功效.
38.自定义中时间网址生成的一个bug.
39.更新Sqlite驱动到最新版.
40.编辑任务修正和最后采集时间没有显示的bug.
41.Sqlite数据库压缩失效的bug.
42.http恳求工具User-agent菜单第一项设置为本机User-Agent.
43.修复了企业版在应用直接入库时不下载图片的bug.

2010-06-01主动升级更新已解决以下问题——————
44.修复了当应用php插件时给标签赋值为null导致采集器退出的bug.
45.在处理不符合记录时,如删除记录,也会删除该记录所下载的文件.
46.增加了随机代理功效.该功效在旗舰版及更高版本中可用.
47.增加了任务完成后数据自检功效.
48.修复了标签调换时,如果出错,将弹出很多出错误框的提示的问题.
49.新增加一选项,当应用多个发布配置时,如果没有全部发布成功,可以设置为已发或未发.
50.增加代码调试,当Web发布失败时,将返回所有的采集器提交的数据及返回的数据.
51.处理了部分FTP上传时提示 在其高低文中,该恳求的地址无效 的问题.
52.修复提取内容图片为缩略图时不下载时不保存图片地址的bug.
53.FTP上传文件时没显示进度条的小bug.
54.增加任务运行时禁止修正任务名,防止修正任务名后呈现采集错误.
55.将网址采集重复的累计盘算方法改成本来的正确的持续重复盘算方法.
56.优化采集过程,减少系统资源应用.

2010-06-09主动升级更新已解决以下问题——————

57.将同时运行任务数限制取消.
58.更新本地数据导出CSV工具到2010版.
59.修复批量工具中全部站点删除不起作用的bug.
60.要害词调换支撑读取utf-8格式文件.

官方网站:http://www.locoy.com/

接洽方法:[email protected]@locoy.com

下载地址:

评论

没安装畅言模块