首页最新资讯

全部 常见问题 新闻动态 技术文章 技术问答

    • 网络爬虫之通用爬虫和聚焦爬虫

      根据使用场景,网络爬虫可分为通用爬虫和聚焦爬虫两种。通用爬虫是捜索引擎抓取系统(Baidu、Google、Yahoo等)的重要组成部分,主要目的是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。聚焦爬虫,是“面向特定主题需求”的一种网络爬虫程序。接下来,就对这两种爬虫分别进行介绍。查看全文>>

      技术文章2021-06-09 |黑马程序员 |通用爬虫和聚焦爬虫
    • NumPy常用的数据类型有哪些?怎样进行转换?

      NumPy支持比Python更多的数据类型。下面介绍一些常用的数据类型,以及这些数据类型之间的转换。通过“ndarray.dtype”可以创建一个表示数据类型的对象。要想获取数据类型的名称,则需要访问name属性进行获取,示例代码如下。查看全文>>

      技术文章2021-06-09 |黑马程序员 |NumPy中常用的数据类型
    • 怎样通过Anaconda管理Python包?

      Anaconda集成了常用的扩展包,能够方便地对这些扩展包进行管理,比如安装和卸载包,这些操作都需要依赖conda。conda是一个在Windows、Mac OS和Linux上运行的开源软件包管理系统和环境管理系统,可以快速地安装、运行和更新软件包及其依赖项。查看全文>>

      技术文章2021-06-09 |黑马程序员 |Anaconda,Anaconda,管理Python包
    • python操作mongodb数据库详解

      要想在Python项目中使用MongoDB数据库,需要在Python标准库的基础上添加对MongoDB的支持。截止到目前,常用的开发MongoDB的包为PyMongo。下面将针对PyMongo的相关内容进行详细介绍。查看全文>>

      技术文章2021-06-08 |黑马程序员 |python操作mongodb数据库
    • ETL常见工具有哪些?

      目前比较流行的ETL工具有Pantlo Kertle、Howk、lormi PowerCene及DataStage,对这些工具的介绍如下。查看全文>>

      技术文章2021-06-08 |黑马程序员 |ETL常见工具
    • ETL常见三类数据清洗的策略

      数据的清洗转换是指将抽取到的数据源表中的数据,根据数据仓库系统模型的要求进行数据的清洗、转换等操作,保证来自不同系统、不同格式数据的一致性和完整性,并且要按照业务要求加载到目标表。数据的清洗转换是ETL中最复杂的部分,主要任务是过滤掉不符合要求的数据。不符合要求的数据主要是有不完整的数据、错误的数据、重复的数据三大类。查看全文>>

      技术文章2021-06-08 |黑马程序员 |ETL数据清洗
和我们在线交谈!