浏览器之家


飞采信息采集系统(ninidown) 1.4

飞采(NiniDown) 是一款基于.NET编写的多线程信息采集系统(应用前必须安装.NET framework 2.0)。通过直观的的规矩制定,模仿浏览器不同的提交行动,可以方便的将浏览器中看到的信息抓取下来,并可以通过在线发布工具或数据库入库工具,将该信息发布到您自己的网站上。其机动的规矩制定,强盛的分页处理和标签定义,打算任务,对Access,Mysql,MSsql的数据库支撑等功效,将有效节俭您的可贵时间,让工作变得更加轻松......

特点介绍:
支撑多任务、多线程:可以同时履行多个采集任务,每个任务又可以应用多个线程,采集速度飞快。
支撑SSL协议,可以采集HTTPS://开头的网页(1.3以后版本)
支撑暂停任务功效,方便以后采集(1.2以后版本)。
支撑表格内容采集,每行数据离开保存到数据库(1.2以后版本)。
支撑多层导航技巧:可以跨层采集,分页采集,分页内容可以合并为一条记录。
支撑采集内容可以多表,跨表保存;可以通过要害字关联,主动整合成一条完整记录。
支撑历史记录功效,方便增量采集,避免重复采集。(免费版不支撑)
支撑固定时间、间隔必定时间采集、全部任务完成后主动关机。
支撑网站登录采集,可以采集需要登录才干看到的页面。
支撑普通、POST、脚本链接采集。对采用函数生成的分页地址也可以采集,参数支撑四则算术表达式盘算(1.2以后版本)。
支撑POST数据、Cookie捕获,通过内置浏览器可以捕获特别cookie,如HttpOnly类型的ASP.NET_SessionId等,方便创立下载、发布规矩。
支撑内容文件下载,可以提取并下载内容中的图片、Flash、附件(常见类型的文件)。
支撑分块传输方法(chuncked),压缩(gzip,deflate)的数据流下载。
支撑采集链接、文件链接筛选功效,对下载的内容标记剔除、文字调换。
支撑模仿提交、源码查看(同web在线发布),方便测试采集规矩。
支撑HTTP恳求头自定义,方便完善模仿各种浏览器恳求动作。
支撑采集内容保存到数据库,方便第三方软件对采集内容进行再加工。
支撑采集成果web在线发布,通过在线方法发布到现有的网站系统。
支撑采集成果数据库入库发布,可以发布到Access、SQL Server、MySQL数据库(支撑存储过程调用,FTP上传采集的文件)。
懂得更多情况,请访问官方网站 http://www.ninidown.com/

下载地址:

评论

没安装畅言模块