火车采集器(LocoySpider)
v10.2.22.228免费版- 软件大小:33.4M
- 更新日期:2022/3/7
- 软件语言:简体
- 软件类别:下载工具
- 软件授权:共享软件
- 软件官网:http://www.locoy.com/
- 适用平台:WinAll
软件介绍精品推荐相关视频人气软件相关文章评论2下载地址
火车采集器LocoySpider是一款专业的功能强大的网络数据/信息挖掘软件,通过灵活的配置,您可以很轻松的从网页上抓取文字、图片、文件等任何资源。
相关软件软件大小版本说明下载地址
- 神奇电商宝贝下载软件 v3.0.0.317官方版110Mv3.0.0.317官方版查看
- 神奇网页图片下载机 v3.0.0.295官方版110.8Mv3.0.0.295官方版查看
- 神奇主图视频下载软件 v3.0.0.255官方版101.6Mv3.0.0.255官方版查看
- Internet Download Manager(idm下载器) v6.39.1官方版7.9Mv6.39.1免费版查看
火车采集器(LocoySpider)是一款专业的功能强大的网络数据/信息挖掘软件,通过灵活的配置,您可以很轻松的从网页上抓取文字、图片、文件等任何资源。
程序支持远程下载图片文件,支持网站登陆后的信息获取,支持探测文件真实地址,支持代理,支持防盗链的采集,支持采集数据直接入库和模仿人手工发布等许多功能特点。
火车采集器支持从任何类型的网站采集获取您所需要的信息,如各种新闻类网站、论坛、电子商务网站、求职招聘网站等。
同时具有强大的网站登录采集、多页和分页的采集、网站跨层采集、POST采集、脚本页面采集、动态页面采集等高级采集功能。
强大的php和c#插件支持,让您可以通过二次开发实现您所想要的任何更强大的功能。
软件特色
1、通用性强
无论新闻、论坛、视频、黄页、图片、下载类网站,只要通过浏览器能看到的结构化的内容,通过指定匹配规则,都能采集到您所需要的内容。
2、稳定、高效
五年磨一剑,软件不断更新进步,采集速度快,性能稳定,占用资源少。
3、扩展性强、适用范围广
自定义web发布,自定义主流的数据库的保存和发布,自定义本地php及.net外部编程接口处理数据,让数据都能为你所用。
菜单功能
1.新建分组
新建一个任务分组,选择所属分组,确定分组名称和备注。
2.新建任务
确定所属分组,新建一个任务,填写任务名称并保存。
3.Web发布配置
Web发布配置定义了如何登陆一个网站以及向该网站提交数据。
主要涉及到登录信息的获取,网站编码设定,栏目列表的获取,以及使用数据测试发布效果。
4.Web发布模块
可以定义网站登录,获取栏目列表,获取网页随机值,内容发布参数,以及上传文件,构造发布数据等高级功能。
5.数据库发布配置
数据库发布配置定义了数据库链接信息的设置以及数据库模块的选择。
6.数据库发布模块
用于编辑数据库的发布模块,方便我们将数据发布到配置好的数据库中。
火车采集器可选mysql、sqlserver、oracle、access四种数据库类型,在文本输入框中填写sql语句
(需有数据库相关知识),并可使用标签替换相应数据。也可在采集器模块文件夹中加载某一模块进行编辑。
7.计划任务
设置列表中采集任务的启动计划,可每间隔、每天、每周、仅一次、或自定义Cron表达式,
(Cron表达式的写法可参考相关术语中的介绍)。保存设置后,任务即可按照设置执行。
8.插件管理
插件是可以用来扩展火车采集器功能的程序
火车采集器V9支持PHP源码、C#源码、C#类库三种类型的插件,
可用于扩展http请求、内容处理和文件下载的功能,并可以分别进行测试。
9.http二级代理
网络中的服务器,可以让网络用户去取得所需要的网络信息。
代理的功能有可以突破自身ip的访问限制访问国外站点,访问一些单位或团体内部资源,
突破电信的ip封锁和隐藏真实的ip等。
火车采集器V9支持http代理、socket4和socket5代理。
10.http模拟请求
可以设置如何发起一个http请求,包括设置请求信息,返回头信息。并具有自动提交的功能。
基本功能
1、规则自定义 - 通过采集规则的定义,可以搜索所有网站采集几乎任何类型的信息。
2、多任务,多线程 - 可以同时进行多个信息获取任务,每个任务可以使用多个线程。
3、所见即所得 - 任务采集过程所见即所得,过程中遍历的链接信息、采集信息、错误信息等都会及时的反映在软件界面中。
4、数据保存 - 数据边采集边自动保存到关系数据库中,并且数据结构能够自动适应,软件可以根据采集规则自动创建数据库,以及其中的表和字段,也可以通过导库方式灵活的将数据保存到客户已有的数据库结构中。
5、断点续采 - 信息收集任务可以在停止后从断点开始继续采集,从此你用不再担心你的采集任务意外中断了。
6、网站登录 - 支持网站Cookie,支持网站可视化登录,即使登录时需要验证码的网站也能采集。
7、计划任务 - 通过这个功能可以让你的采集任务定时、定量或者一直循环执行。
8、采集范围限制 - 可以根据采集的深度和网址的标识来限制采集的范围。
9、文件下载 - 可以将采集到的二进制文件(诸如:图片、音乐、软件、文档等等)下载到本地磁盘或者采集结果数据库中。
10、结果替换 - 可以将采集的结果根据规则替换成你定义的内容。
11、条件保存 - 可以根据某个条件来决定那些信息保存,那些信息过滤。
12、过滤重复内容 - 软件可根据用户设置和实际情况对重复内容和重复网址自动删除重复内容。
13、特殊链接识别 - 运用此功能可以将用JavaScript动态生成的链接或其他更古怪的连接识别出来。
14、数据发布 - 可以通过自定义接口,将已采集的结果数据发布到任意的内容管理系统和指定数据库中。现在已支持的目标发布媒体包括:数据库(access, sql server,my sql,oracle) ,静态htm文件。
15、预留编程接口 - 定义多个编程接口,用户可以在事件中利用PHP,C#语言进行编程,扩充采集功能。
特色功能
1、支持所有网站编码:完美支持采集所有编码格式的网页,程序还可以自动识别网页编码。
2、多种发布方式:支持目前所有主流和非主流的CMS,BBS等网站程序,通过系统的发布模块能实现采集器和网站程序间的完美结合。
3、全自动:无人值守工作,配置好程序后,程序将依据您的设置自动运行,完全无需人工干预。
4、本地编辑:本地可视化编辑已采集的数据。
5、采集测试:这是其它任何同类采集软件所不能比的,程序支持直接查看采集结果并测试发布。
6、管理方便:使用站点+任务方式管理采集节点,任务支持批量操作,再多的数据管理也很轻松。
更新日志
1.新增:User-Agent支持从文本读取并随机切换。教程:http://faq.locoy.com/q-1348.html。
2.新增:自动识别手机号功能支持14、15、16、17、19开头的新号段。
3.优化:文件下载完毕插件接口优化。
4.优化:探测文件下载时正式下载文件,提升下载速度。
5.修复:http请求头“Header或设置名”以数字开头的名称报错的问题修复。
6.修复:发布到word文档,如果数据包含特殊字符或本地图片异常会导致发布失败问题修复。
7.修复:拷贝任务时,任务备注未拷贝问题修复。
8.修复:标签引用支持调用“列表页”标签。
9.修复:json提取时如果json对象的“键”是整型导致提取有误。
10.优化:网址解析替换html问题。
11.修复:get、post分页问题处理。
12.修复:生成固定格式的数据中“系统时间”选中“06-16”生成时间格式“yyyy-MM”
13.新增:数据库发布模块支持replace into语句。
精品推荐爬虫软件小说采集器数据采集软件
- 更多 (15个) >>爬虫软件网络爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本,网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成,爬虫软件首要的功能就是爬取网页数据,目前的采集
八爪鱼采集器89.3M
/简体神箭手客户端77.3M
/简体关关采集器1.7M
/简体后羿采集器47.6M
/简体GooSeeker浏览器30.3M
/简体熊猫智能采集软件12.1M
/简体水淼万能文章采集器5KB
/简体冰糖自媒体图文素材采集器6.6M
/简体简易小说采集器32KB
/简体全自动无人值守采集软件(Editortools)22.9M
/简体
- 更多 (11个) >>小说采集器小说采集器等同于网页采集器,采集是指有着确定方向明确目的的采撷和记录写作材料的一种活动,小说采集器能够用来批量采集网页,论坛等的内容,让你您可以很轻松的从网页上抓取文字图片文件等任何资源,适合小说网站
八爪鱼采集器89.3M
/简体关关采集器1.7M
/简体水淼万能文章采集器5KB
/简体冰糖自媒体图文素材采集器6.6M
/简体简易小说采集器32KB
/简体全自动无人值守采集软件(Editortools)22.9M
/简体后羿采集器47.6M
/简体文章伪原创工具(skycc)20.4M
/简体友益网站数据采集器671KB
/简体草根万能采集器13M
/简体
- 更多 (20个) >>数据采集软件数据采集软件或者叫采集器,就是采集的机器或者工具。网页采集软件就是为了解决从网页上采集信息的需求而由专业的互联网软件公司研发的一整套工具软件。用于实现自动化采集从大批量网页上采集数据。数据采集软件是用
八爪鱼采集器89.3M
/简体网探1.3M
/简体网络矿工数据采集软件25.7M
/简体云流电影采集器1.0M
/简体守望数据采集器2.9M
/简体友益网站数据采集器671KB
/简体零视界域名回收采集器968KB
/简体麒麟网站图片采集器2.4M
/简体水淼网络图片采集器1.1M
/简体网络图片采集大师1.4M
/简体
其他版本下载
相关视频
-
没有数据
人气软件
BitComet(比特彗星)2.4M
/简体洛雪音乐助手120.6M
/简体MusicTools(音乐免费下载软件)5.2M
/简体qBittorrent15.8M
/多国语言[中文]迅雷29.8M
/简体BitTorrent29.6M
/简体Internet Download Manager(idm下载器)7.9M
/简体冰点文库下载器(免积分下载百度文档)4.0M
/简体豆丁文档下载器(冰点)5.8M
/简体M3u8 Downloader(M3U8下载)21.2M
/简体
厂商其他下载
- 电脑版安卓版IOS版Mac版
-
快车(FlashGet)7.4M
/简体VeryCD 电驴(easyMule)4.1M
/简体Opera浏览器81.8M
/简体光影魔术手19.1M
/简体360安全浏览器7.044.6M
/简体格式工厂103.0M
/多国语言[中文]365桌面日历9.6M
/简体福昕PDF阅读器(Foxit Reader)88.4M
/简体快播(QvodPlayer)12.2M
/简体快玩游戏盒31.7M
/简体
优志愿57.2M
/简体全民枪战2.01.40G
/简体北京公交103.2M
/简体泰拉瑞亚245.9M
/简体迷你世界582.3M
/简体江苏高考16.0M
/简体小米枪战1.31G
/简体腾讯疯狂贪吃蛇48.3M
/简体腾讯街头篮球544.2M
/简体深海大作战手机版30.9M
/简体
跑跑卡丁车40.7M
/简体高考志愿君app63.9M
/简体传奇战域手游491M
/简体像素车超改iphone版370.4M
/简体代号英雄iphone版371.2M
/简体人vs导弹游戏iphone版224.5M
/简体北京公交16.5M
/简体熊猫看书iPad版32.9M
/简体影音先锋iPad版0KB
/简体WPS iPad版228M
/简体
Betterzip Mac23.9M
/简体IINA Mac版77M
/英文多宝游戏盒Mac版90.2M
/简体eZip Mac版15.7M
/简体ios5.1固件802M
/简体Adobe Photoshop CS6 Mac版1.05G
/简体英雄联盟Mac版66.2M
/英文magican for mac12.1M
/简体虾歌Mac版9M
/简体欧朋浏览器for mac169.3M
/简体
相关文章
查看所有评论>>网友评论共2条
热门关键词
精彩评论
支持( 4 ) 盖楼(回复)
支持( 8 ) 盖楼(回复)