做企业培训,当然要找对好讲师!合作联系

郭振杰:Python网络爬虫与数据处理

郭振杰老师郭振杰 注册讲师 146查看

课程概要

培训时长 : 3天

课程价格 : 扫码添加微信咨询

课程分类 : 工作技能

课程编号 : 15257

面议联系老师

适用对象

想学习Python爬虫编程,并具备Python基础编程能力人员

课程介绍

【课程背景】

Python语言是当前最火的语言之一,易于使用,学习曲线低。Python具备丰富成熟的网络库和数据处理库,可以快速的进行网络信息爬取、数据初步处理,并可以应对复杂的网络环境、网站环境。 本课程系统讲述Python的网页内容获取库、网页结构和相关协议、HTML内容解析、异步处理以及复杂网络环境数据获取工具。通过本课程,可以初步掌握使用Python进行网络信息爬取的能力。课程结合案例和练习,注重知识的掌握和使用,重点培养学员的实操能力。

【课程收益】

培训完结后,学员能够:

  • 了解网页结构和相关协议
  • 掌握Python网页内容获取库
  • 掌握Python网页内容解析方法
  • 掌握常用爬虫库

【课程对象】想学习Python爬虫编程,并具备Python基础编程能力人员

【课程时长】3天 (6小时/天)

【课程大纲】

单元大纲内容
单元一绪论
  1. 爬虫介绍
  2. 爬虫应用
  3. 爬虫技术介绍
单元二Python简单爬虫开发
  1. 使用Python获取网页源代码
  2. 多线程爬虫
  3. 爬虫常见搜索算法
  4. 阶段练习:百度页面爬取
单元三高性能html解析
  1. HTML介绍
  2. 正则表达式介绍
  3. 通过正则表达式获取页面数据
  4. XPATH介绍
  5. 通过XPATH快速获取数据
  6. Beautiful Soup4介绍和使用
  7. 阶段练习:招聘信息爬取
单元四异步加载和请求
  1. HTTP协议简介
  2. 网页结构简介
  3. Ajax简介
  4. 异步加载
  5. 伪造请求头
  6. 阶段练习:获取视频网站评论
单元五模拟登陆与验证码
  1. 网站登录原理介绍
  2. 模拟登陆
  3. 验证码机制
  4. 验证码处理
  5. 阶段练习:模拟网站登录操作
单元六Scrapy爬虫框架
  1. Scrapy介绍与安装
  2. Scrapy的使用
  3. Scrapy与数据库
  4. Scrapy与Redis
  5. Scrapy中间件
  6. Scrapy爬虫部署
单元七整体练习根据实际情况设定一个实验课题

郭振杰老师的其他课程

• 郭振杰:Python数据分析
【课程背景】Python语言是当前最火的语言之一,易于使用,学习曲线低。通过Python语言可以快速的进行数据处理、数据分析,并可以进行多样式的数据展示。本课程系统讲述Python的数据分析和展示功能。通过本课程,可以初步掌握使用Python进行数据分析、图形化输出结果。【课程收益】培训完结后,学员能够:掌握Python常用数据分析方法掌握Python进行统计图表输出【课程对象】具有Python基础,希望学习Python进行数据分析人员【课程时长】2-3天 (6小时/天)【课程大纲】单元大纲内容单元一NumPy  数组与数据运算NumPy介绍与安装NumPy数组对象与操作NumPy矩阵操作NumPy进行统计跟随练习:模拟进行客户统计单元二pandas数据分析pandas介绍与安装pandas的数据结构与常用操作pandas的数据运算pandas的函数应用pandas的数据读取与写入pandas的数据方法跟随练习:模拟进行客户统计单元三数据可视化Matplotlib介绍与安装Matplotlib配置Matplotlib经典图形绘制Matplotlib图形调整及美化阶段练习:将前述统计结果进行展示单元四数据预处理数据清洗数据合并数据抽取数据规整阶段练习:混杂的用户数据进行处理
• 郭振杰:Python基础与自动化办公
【课程背景】Python语言是当前最火的语言之一,易于使用,学习曲线低。通过Python语言除了可以快速的进行数据处理、数据分析,数据展示外。可以通过脚本进行办公文件、办公系统的自动化操作。本课程系统讲述Python环境搭建、基础语法、高级语法、异常处理等编程基础,以及Python的自动化办公功能。通过本课程,可以初步掌握使用Python编程,具备使用Python进行办公文件和办公系统的自动化操作基础。课程结合案例和练习,注重知识的掌握和使用,重点培养学员的实操能力。【课程收益】培训完结后,学员能够:自己搭建Python语言运行环境掌握Python编程工具掌握Python基础编程能力掌握Python操作word、ppt、excel的能力掌握Python自动操作办公系统能力【课程对象】想学习Python,进行数据处理人员【课程时长】5天 (6小时/天)【课程大纲】单元大纲内容单元一Python绪论Python介绍运行和开发环境安装跟随练习:开发和运行环境安装单元二Python基础语法Python程序结构变量与数据类型运算符和表达式阶段练习:字符串处理单元三流程控制结构赋值语句条件语句循环语句阶段练习单元四函数与模块函数定义和使用函数参数模块引用常用模块介绍阶段练习单元五异常处理异常概述异常处理流程自定义异常阶段练习单元六文件操作基础文件概述打开文件基本的文件方法基本的目录操作阶段练习单元七办公文件操作WORD文档操作PPT文档操作Excel文档操作阶段练习单元八办公系统操作办公系统基础知识Selenium自动化操作库介绍与安装办公系统页面内容操作办公系统页面信息获取鼠标操作浏览器处理单元九基于B/S结构业务系统基础技术介绍HTTP协议简介HTML介绍网页结构简介CSS简介XPATH介绍和使用CSS_Selector 相关知识介绍单元十实践练习完成在线平台操作
• 郭振杰:Python基础与数据操作分析
【课程背景】Python语言是当前最火的语言之一,易于使用,学习曲线低。通过Python语言可以快速的进行数据处理、数据分析,并可以进行多样式的数据展示。本课程系统讲述Python环境搭建、基础语法、高级语法、面向对象编程、异常处理等编程基础,以及Python的数据分析和展示功能。通过本课程,可以初步掌握使用Python编程,使用Python进行数据操作和进行数据分析。课程结合案例和练习,注重知识的掌握和使用,重点培养学员的实操能力。【课程收益】培训完结后,学员能够:自己搭建Python语言运行环境掌握Python编程工具掌握Python基础编程能力掌握Python基础数据操作掌握Python常用数据分析方法掌握Python进行统计图表输出能够使用Python进行数据预处理【课程对象】想学习Python,进行数据处理人员【课程时长】5-6天 (6小时/天)【课程大纲】单元大纲内容单元一Python绪论Python介绍运行和开发环境安装跟随练习:开发和运行环境安装单元二Python基础语法Python程序结构变量与数据类型运算符和表达式阶段练习:字符串处理单元三流程控制结构赋值语句条件语句循环语句阶段练习单元四函数与模块函数定义和使用函数参数模块引用常用模块介绍阶段练习单元五异常处理异常概述异常处理流程自定义异常阶段练习单元六文件操作文件概述打开文件基本的文件方法基本的目录操作阶段练习单元七数据库介绍与操作CSV数据操作数据库介绍Python操作Mysql数据库单元八NumPy  数组与数据运算NumPy介绍与安装NumPy数组对象与操作NumPy数学运算NumPy进行统计阶段练习单元九pandas数据分析pandas介绍与安装pandas的数据结构与常用操作pandas导入导出数据pandas的统计操作阶段练习单元十数据可视化Matplotlib介绍与安装Matplotlib配置Matplotlib经典图形绘制Matplotlib图形调整及美化阶段练习单元十一Python自动化办公介绍Python操作Excel库介绍Python操作PPT库介绍Python操作Word库介绍Python操作PDF库介绍Python操作办公系统实现方案介绍

添加企业微信

1V1服务,高效匹配老师
欢迎各种培训合作扫码联系,我们将竭诚为您服务