
会员
网络数据采集技术:Java网络爬虫实战
更新时间:2020-09-29 15:50:25 最新章节:9.4 本章小结
书籍简介
本书以Java为开发语言,系统地介绍了网络爬虫的理论知识和基础工具,包括网络爬虫涉及的Java基础知识、HTTP协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站,采用案例讲解的方式介绍网络爬虫中涉及的问题,以增强读者的动手实践能力。同时,本书还介绍了3种Java网络爬虫开源框架,即Crawler4j、WebCollector和WebMagic。本书适用于Java网络爬虫开发的初学者和进阶者;也可作为网络爬虫课程教学的参考书,供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的本科生和研究生参考使用;也可供企业网络爬虫开发人员参考使用。
上架时间:2020-01-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
最新章节
钱洋等
最新上架
- 会员本书是与朱鸣华、罗晓芳、董明等编著的《C语言程序设计教程》配套使用的习题解答与上机指导,根据教学要求设置了三部分内容,包括C语言编程环境简介、知识提要及习题解析、上机指导及实验。本书首先介绍计算机程序实验的一般方法以及在VisualC++2010下编写和调试C语言程序的具体步骤;然后对主教材各章后面的习题以及C语言程序设计课程学习中的疑难问题和常见问题进行了详细的解析,同时,还汇总了各章的知识计算机6.3万字
- 会员本书从初学者的角度出发,由浅入深地讲解了Java语言的相关内容。全书共11章,主要介绍了Java开发环境的搭建及其运行机制、基本语法、面向对象编程思想、多线程、常用API、集合、I/O、网络编程等内容,采用通俗易懂的语言阐述抽象的概念,选用生活中密切相关的例子演示知识的运用,通过剖析案例、分析代码含义、解决常见问题等方式进行讲解。书中还添加了许多阶段性任务来模拟程序开发过程,帮助初学者培养良好的编计算机10.6万字
- 会员《细说PyTorch深度学习:理论、算法、模型与编程实现》由业界专家编撰,采用理论描述加代码实践的思路,详细介绍PyTorch的理论知识及其在深度学习中的应用。全书分为两篇,共16章。第一篇为基础知识,主要介绍PyTorch的基本知识、构建开发环境、卷积网络、经典网络、模型保存和调用、网络可视化、数据加载和预处理、数据增强等内容;第二篇为高级应用,主要介绍数据分类、迁移学习、人脸检测和识别、生成对计算机11.1万字
- 会员《Oracle从入门到精通(第5版)》从初学者角度出发,通过通俗易懂的语言和丰富多彩的实例,详细介绍了使用Oracle19c进行数据管理的各方面技术。全书分为4篇,共21章,内容包括Oracle19c概述,Oracle体系结构,Oracle管理工具,SQL*Plus命令,SQL语言基础,PL/SQL编程,过程、函数、触发器和包,管理控制文件和日志文件,管理表空间和数据文件,数据表对象,其他数据对象计算机25.5万字
- 会员本书重点关注和介绍SpringBoot2框架的技术应用。SpringBoot是目前微服务架构使用最为广泛的框架之一,一旦开发人员掌握了该框架的配置和使用技巧,则对于当前微服务应用的开发将得心应手。本书详细介绍了SpingBoot2的开发环境、开发方式、数据库应用、MVC、RESTful、安全及测试等。对于刚开始接触微服务架构、SpringBoot的开发人员来说,这是一本很适合的书籍。本计算机8.6万字
- 会员随着人机交互和AI技术的快速发展,设计师需要从基于屏幕的图形用户界面设计思维,转变为空间交互及智能交互的设计思维。本书从设计师要懂技术的原因讲起,引导设计师结合技术去思考设计,并针对跨设备交互设计、基于AI的设计及各种传感技术(姿态和手势识别、人脸识别和追踪、眼动追踪等)进行解读与案例分析,帮助设计师更好地应对未来的工作挑战。计算机15.8万字
- 会员OpenCV作为一个应用广泛的开源计算机视觉库,正在受到越来越多的关注。目前OpenCV的各类教程基本上以Python和C++为主,基于Java的OpenCV书籍则少之又少,本书旨在弥补这一空白。本书共13章,前4章是基础部分,包括OpenCV概述和安装配置、数字图像基础及图像基础操作等内容;第5到11章则包括了图像的几何变换、图像平滑、形态学操作、直方图、边缘检测与轮廓、霍夫变换、特征点检测和匹计算机6.9万字
- 会员Docker是目前流行的容器平台。作为开发、发布和运行应用程序的开放平台,Docker为快速发布、测试和部署应用程序提供了一整套技术和方法。《Docker与Kubernetes容器虚拟化技术与应用》主要围绕容器生态体系中的核心组件Docker和Kubernetes展开,介绍了容器的组成及相关概念、容器系统架构和运行原理,重点剖析了Docker和Kubernetes两大工具的核心概念、组成和工作原理计算机9.6万字
- 会员《C#从入门到精通(第7版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了使用C#进行Windows应用程序开发方方面面的技术。全书分为4篇,共25章,包括初识C#及其开发环境、C#程序基本结构、变量与常量、表达式与运算符、字符与字符串、流程控制语句、数组和集合、面向对象编程、Windows窗体应用程序设计、Windows窗体应用程序常用控件、Windows窗体应用程序高级控件计算机17.8万字
同类书籍最近更新
- 会员本书从入门到实践对谷歌移动UI框架Flutter应用进行了全面的介绍。本书从逻辑上可以分为四部分。第一部分(第1~3章)从开发环境的搭建入手,主要介绍Dart语言基础与高级应用,从基础语法到函数、泛型、异步编程、模块使用等高级内容。第二部分(第4、5章)主要介绍Flutter的核心组件,除了介绍开发Flutter应用必备的图片、文本、图标、按钮等基础组件外,还详细介绍了表单组件、布局技术、交互组件程序设计6.9万字
- 会员本书以VisualBasic.NET语言作为程序实现工具,介绍程序设计的基本思想和方法。全书共分两篇,其中:学习篇介绍VisualBasic.NET语言的基本知识、程序设计的基本方法以及实际应用开发,其内容包括VisualBasic.NET概述、程序的数据描述、顺序结构程序设计、选择结构程序设计、循环结构程序设计、数组、过程、用户界面设计、图形操作、文件、数据库应用;实验篇提供实验指导,其中包括1程序设计12.2万字
- 会员Python语言是当前最活跃的开发语言之一,在数据科学领域、网络爬虫领域、Web开发领域、服务器自动化运维及游戏领域都有着非常广泛的应用。尤其是在数据科学领域,越来越多的数据科学家开始将Python语言作为主要的工具。本书以Windows操作系统为平台,系统讲解Python3的基础知识。全书共10章,首先介绍了Python语言的基础入门,开发环境搭建,必备的基础语法,如变量与数据类型、流程控制语句程序设计8.1万字
- 会员《Web前端测试与集成——Jasmine/Selenium/Protractor/Jenkins的最佳实践》详细介绍了Web前端开发与测试的理论,以及基于Jasmine、Selenium、Protractor和Jenkins如何进行全生命周期的测试与集成。《Web前端测试与集成——Jasmine/Selenium/Protractor/Jenkins的最佳实践》共分四个部分。第一部分为基础篇,总览程序设计11.9万字
- 会员IfyouhaveaworkingknowledgeofHadoop1.xbutwanttostartafreshwithYARN,thisbookisidealforyou.YouwillbeabletoinstallandadministeraYARNclusterandalsodiscovertheconfigurat程序设计2.9万字