网页抓取工具Easy Web Extract 是一个易于使用的网页抓取工具,来提取网页中的内容(文字,网址,图片,文件),并只通过几屏的点击转化成果转化为多种格式。无编程要求。使我们的网页抓取工具,以便易于使用作为其名称。
软件说明:
我们简单的网络提取软件包含了许多先进的功能。
使用户能够从简单的刮内容复杂的网站。
但不需要任何努力来建立一个网页抓取的项目。
在这个页面中,我们将向您只需知名的特点。
使我们的网页抓取工具,以便易于使用作为其名称。
功能特点:
1. 很容易地创建一个提取项目
在创建一个基于向导窗口中的新项目是从来没有简单的任何用户。
该项目安装向导将推动你一步一步。
直到所有必要任务完成。
以下是一些主要步骤:
第1步:输入一个起始URL,它是起始页面,网页刷屏将加载。
它往往是一个链接到一个刮产品列表
第2步:输入关键词来提交表单,得到的结果,如果网站需要。本步骤可以在大多数情况下被跳过
第3步:在列表中选择一个项目,选择项目的数据列的刮性能
第4步:选择下一个页面的URL来访问其他网页
2. 在多线程刮数据
在Web拼抢项目,几十万的链接需要被抓取收获。
传统的刮削器可能需要您serveral的数小时或数天。
然而,简单的网络提取物可以同时运行多个线程同时浏览高达24个不同的网页。
以节省您宝贵的时间,等待收获的结果。
因此简单的网络提取物可以利用你的系统的最佳性能。
在旁的动画形象展示提取8个线程。
3. 从数据加载各种抽取数据
一些高度动态的网站采用基于客户端创建如AJAX异步请求的数据加载技术。
这是真的,不仅原始网页scapers,还需要专业的网络刮工具的挑战。
因为网络内容没有嵌入HTML来源中。
然而,简单的网络提取物具有非常强大的技术。
使即使是新手,从这些类型的网站中获得数据。
此外,我们的网站刮板甚至可以模拟向下滚动到页面底部加载更多的数据。
如LinkedIn联系人列表中的某些特定的网站。
在此challange,大多数Web铲运机的不断收获了巨大的重复信息。
并迅速成为单调乏味。不过,不用担心这个噩梦。
因为简单的网络提取物具有智能功能,以避免它。
4. 自动执行项目任何时候
通过简单的网络提取的嵌入式自动运行的调度程序。
你可以安排在任何时候无需任何操作运行Web刮项目。
该计划任务运行和出口刮掉结果到目的地。
没有任何始终运行,后台服务,以节省系统资源。
此外,所有的重复可以从所收获的结果被删除。
以确保只有新的数据被保持。
支持的日程表类型:
- 运行项目中的每个小时
- 运行项目中的每个天
- 在特定时间运行项目
5. 导出数据到任何格式
我们最好的网络刮板支持各种格式导出刮掉网站数据。
例如:CSV,访问,XML,HTML,SQL服务器,MySQL的。
您也可以直接提交导致的任何种类的数据库目的地。
通过ODBC连接。如果你的网站有一个提交表单。
你甚至可以通过HTTP POST提交他们或获取。
数据自动导出到您预先定义的格式一旦数据提取完成。
或者你可以导出手动刮结果的任何时间。
6. 还有更多其他...
简单的网络提取物有更多其他的功能一一列出,但您可能会感兴趣的一些几个:
- 强大的转换脚本来变换分析中的任何一种形式的刮数据。
我们的网页抓取工具提供了一些准备使用的脚本,如(子串的选择,更换,分割...)。
或者如果你有一些编程的C#或VB.NET的知识,你可以编写自己的脚本
- 随机抽取的延迟,以避免阻塞远程主机。
有些网站会阻止您的IP地址访问。
如果你在很短的时间发送多个requets来保护其数据。
此功能可以帮助您在许多情况下。
- 支持图片列表类型从Web区域下载所有产品图片。
非常有用的刮所有产品的图片库。
- 通过命令行执行的项目。
启用轻松拨打我们的网页抓取从自己的应用程序的工具
- 登录,以确保面板由你定的凭据中提取的私人数据
- 以及更多...