CDA数据分析师
北京Python爬虫及文本分析学术应用培训班

人气:15 教学点:1个 在线咨询

上课时段:灵活安排

班  型:详询

上课方式:网课,录播,直播,面授

授课机构:北京国富如荷教育

咨询电话

400-0909-044

课程详情
2024-02-18
课程概要Python爬虫及文本分析学术应用培训班课程致力于讲授完整的结构化数据、文本数据的获取、存储、读取、处理和分析过程,通过该课程的学习,我们的学员将不再单一依靠开源公开数据网站的数据,适当摆脱对国家统计年鉴、wind数据库、知网数据的依赖,能够从更多元的渠道获取数据,使用python更高效的处理数据,并用更前沿的技术分析和挖掘数据信息,为我们的科研工作减轻中间工作负担。
Python爬虫及文本分析学术应用
课程介绍
课程简介

本课程致力于讲授完整的结构化数据、文本数据的获取、存储、读取、处理和分析过程,我们期望课程可以帮助到广大的用户,包括所有想要使用python编程语言实现数据获取和文本分析的在校师生、以及致力于将数据分析与挖掘的价值广泛运用到实际场景的商业人士。

学习目标

包括Python编程基础,Python爬虫学术应用和Python文本分析实战,通过该课程的学习,我们的学员将不再单一依靠开源公开数据网站的数据,适当摆脱对国家统计年鉴、wind数据库、知网数据的依赖,能够从更多元的渠道获取数据,使用python更高效的处理数据,并用更前沿的技术分析和挖掘数据信息,为我们的科研工作减轻中间工作负担。

学习对象和基础

从事经济学、资源环境、地理科学、城市、人口、房地产、数理统计、管理科学、计量经济等方面研究的教师、研究员
相关领域的硕士、博士研究生
不要求学过Python操作

 
课程大纲

01章概述 爬虫与文本分析概述

01-01结构化数据/文本数据的获取方法概述
01-02高效的编程语言实现结构化数据处理与文本分析的价值

02章编程基础

02-01python编程基础(标准数据类型,控制流,自定义函数,类,os文件处理模块)
02-02python重要数据科学计算库(Numpy,Pandas,Matplotlib,Pyecherts,wordcloud)

03章数据获取

03-01爬虫基础(网络爬虫简介,爬虫的基本原理,HTML 简介,数据存储)
03-02网页抓取(使用 Urllib网页抓取,requests实战)
03-03BeautifulSoup4(简介,安装,BS 对象的种类,遍历文档树,搜索文档树)
03-04Xpath(什么是Xpath,Xpath开发工具,Xpath常用规则)
03-05动态渲染页面抓取(Selenium的安装,基本使用,声明浏览器对象,访问页面,定位元素,节点交互,动作链,执行 JavaScript,获取节点信息,延时等待,前进后退,Cookies,选项卡管理,异常处理)
03-06爬虫实战(网站的爬取,基电商评价文本爬取)

04章数据存储与读取

04-01可供读取数据类型介绍(excel、pdf、txt、html、mysql数据库文件介绍)
04-02数据的存储(将数据存储到excel表,txt文本,word文档)
04-03数据的读取(python批量读取多个多子表excel,python读取txt文件,word文档)

05章数据处理

05-01正则表达式(什么是正则表达式,正则表达式匹配规则,re模块的使用)
05-02文本处理常用方法(字符串的不变性,排序行,段落格式化,二进制转化为ASCII,重复字词过滤,提取邮件地址,提取URL地址,大写转换,符号化,删除停用词,同义词与反义词处理,文本翻译,单词替换,拼写检查,WordNet接口,语料访问,标记单词,块和裂口,块分类,文本分类,双字母组,文字改写,文字换行,频率分布,文字摘要,词干算法,约束搜索)
05-03结构化数据处理--数据清洗(numpy数值计算要点串讲,Pandas数据处理串讲,python统计图表展示)

06章文本分析实战

06-01重要的库(jieba库简介)
06-02关键词提取(关键词任务概述,TF-IDF算法原理,相似文章推荐原理介绍,实例:红楼梦文本分析的实现,文件与词库的读取,完成分词与词云图的绘制)
06-03文本分类(新闻素材介绍,新闻内容的关键词提取,词向量转化与ngram模型,朴素贝叶斯算法完成新闻分类)
 
CDA数据分析师

“CDA数据分析师”是公司负责运营的专注于数字化人才认证、培养及企业数据服务的品牌,致力于大数据、AI技术在产、学、研的融合应用。服务百万数字化人才,是全球500强的忠实合作伙伴。 作为数据领域权威人才认证——CDA官方推荐的培训教育机构,CDA数据分析师成立15年来始终在总结、凝练先进数字化商业数据策略及技术应用实践,以实际行动提升了数字化人才的职业素养与能力水平,以建设的高质量生态圈层促进了行业的持续快速发展。

更多培训课程,学习资讯,课程优惠,课程开班,学校地址等学校信息,请进入 北京国富如荷教育 北京国富如荷教育 你也可以留下你的联系方式,让课程老师跟你详细解答 400-0909-044 在线咨询
预约申请试听课程

只要一个电话,我们免费为您回电

校区分布(1个)

查看全部校区

推荐课程
  1. 北京CDA机器学习与深度学习周末集训营
  2. 北京Python数据分析速成班
  3. 北京Python开发工程师就业班
  4. 北京Python基础及案例应用集训高级班
  5. 北京Python大数据与人工智能(学术)高级班
  6. 北京Python基础及案例应用集训初级班

关于我们 | 联系我们 | 咨询电话:400-0909-044

路问教育合作机构 ©版权所有 版权/投诉

川公网安备 51019002004404号

 以上信息知识产权归“北京国富如荷教育”所有,并对内容的真实性和合法性负责,如有侵权或投诉,请联系我们处理。

路问培训网> 计算机IT培训课程 > python培训课程 > 北京Python爬虫及文本分析学术应用培训班

还没有找到合适的课程?赶快告诉课程顾问,让我们顾问马上联系您! 靠谱的培训课程,省时又省力!