标签为 #java# 的博客
常见的正则表达式写法总结

正则表达式非常有用,非常强大,但也并不容易写,在这里我们总结一些常用的正则表达式写法

小木 476 2017/11/18 09:20:50 java/正则表达式
Java爬虫入门简介(一) —— HttpClient请求

使用爬虫获取数据对科研来说及其重要,本系列博客将讲述如何使用Java编写爬虫工具获取网页数据。包括HttpClient 4.3及以上版本的Header设置,请求参数设置等。

小木 1313 2017/11/08 15:24:56 HttpClient/Java/爬虫
Java爬虫入门简介(三) —— Jsoup解析HTML页面

使用爬虫获取数据对科研来说及其重要,本系列博客将讲述如何使用Java编写爬虫工具获取网页数据。在这篇博客里,我们将简单介绍Jsoup解析HTML页面的操作。

小木 820 2017/11/08 11:16:51 HttpClient/Java/Jsoup/爬虫
Java爬虫入门简介(五)——抓包工具的使用以及使用HttpClient模拟用户登录的访问

网络爬虫需要解决的一个重要的问题就是要针对某些需要用户名和密码访问的页面可以模拟用户自动登录。在这一篇博客中我们将介绍如何使用Chrome浏览器自带的抓包工具分析页面并模拟用户自动登录

小木 1293 2017/11/04 09:28:53 HttpClient/Java/爬虫
HFUTUtils的使用

HFUTUtils是一个工具程序集合,方便我们平时处理数据。针对文本处理的内容较多。使用起来非常简单。是本人平时使用Java处理数据时候写的工具,方便数据预处理的。

小木 729 2017/05/31 19:52:20 HFUTUtils/java