致力于打造数据抓取技术 1、写脚本 2、哈工大的《基于行块分布函数的通用网页正文抽取》 3、大名鼎鼎的arc90实验室的Readability https://github.com/kingwkb/readability