维易网络爬虫智能抓取正文接口

接口上线,请在会员中心申请使用!
维易网络爬虫智能抓取正文接口,即将开放接入,全智能提取指定网页的文章正文,对文章提取准确率高达95%,并在下一个版本做进一步强化。强化图片类型抓取准确率。
和一般抓取不同的是,我们不仅仅抓取指定网页上当页内容,更有强大的分页匹配抓取功能,只要提供首页URL地址,不管分页多少,都可以按原有文章分页数保留下来。 让您的文章完整不断档。而普通的抓取只会提取第一页,基本上没有分页匹配。
 
  • 全智能

    只要提供一个网址,自动抓取站名、标题、关键字、描述、分页、文章时间,不需要做任何的多余的操作。也不需要给接口指定其它参数。
  • 高准确度

    测试准确率高达95%,几乎适合于各种文章内容型网页抓取。下一个版本将增强图片抓取,会进一步提高准确度。
  • 更全面

    我们不仅自动抓取标题、正文、分页,更提供了该页详尽的信息:作者、来源、时间、分页数等等,让您轻松处理数据。

维易智能抓取正文图例:

以下示例都是只提供一个网址,其余由程序完成后,所返回的参数值图示。
维易网络爬虫的示例
 

客服

关注