易采网站数据采集系统 1.8.4
软件特点:
1.图形化的采集任务定义界面 你只需在软件内嵌的浏览器内用鼠标点选你要采集的网页内容即可配置采集任务,无需像其它同类软件一样面对复杂的网页源码去寻找采集规矩。可以说是所见即所得的采集任务配置界面。
2.创新的内容定位方法,定位更正确、稳固 同类软件基础上都是根据网页源码中的前导标记和结束标记进行内容定位,这样一来,用户就不得不自己去面对网页制作人员才需要面对的HTML代码,付出更多额外的学习时间才干控制软件的应用。同时,只要网页内容稍有变更(简略的如转变一下文字的色彩)定位标记即极有可能失效,导致采集失败。我们经过艰巨的技巧攻关,实现了全新的定位方法:结构定位和相对标记定位。大家都知道,一个网站的作风基础上是固定的,其同类网页内容的编排布局基础雷同。这就是结构定位可行之处。当然基础雷同不等于100%雷同,不过,我们攻克了技巧难关,打消了这些障碍。我们的定位方法的优势在于:1.用户只需用鼠标点击就可以配置采集任务,实现所见即所得的采集任务配置界面;2.网页内容的变更(如文字增减、变更,文字色彩、字体的变更等)不会影响采集的正确性。
3.支撑任务嵌套,可采集无穷级的页面内容 只需在当前任务的页面中选择指向你要采集的下级页面的链接,即可建立嵌套任务,采集下级页面的内容,且嵌套级数不限。这种方便都得益于我们全新的内容定位方法和图形化的采集任务配置界面。
4.可同时采集任何内容 除了最基础的文字、图片、文件外,还可以采集针对具体HTML标签的源码、属性值等。
5.强盛的信息主动再加工才能 你可以在配置任务的时候,指定对采集到的内容进行任何的调换、筛选。
6.可对采集到的内容进行主动排序
7.支撑采集成果保存到EXCEL和任意格式的文件 支撑自定义文件模板。
8.支撑实时保存到数据库 支撑ACCESS、SQLSERVER、MYSQL数据库(后续版本还将支撑更多类型的数据库)。
9.支撑实时上传到网站服务器 支撑POST和GET方法,可自定义上传参数,模仿人工提交。
10.支撑实时保存到任意格式的文件 支撑自定义模板,支撑按记录保存和将多个记录保存到单个文件,支撑大纲、明细式的保存(所有记录的某些内容保存到一个大纲文件中,然后每条记录又单独保存到一个文件。
11.支撑多种机动的任务调度方法,实现无人值守采集
12.支撑多任务,支撑任务导入和导出
相关推荐
评论
没安装畅言模块