登陆

章鱼彩票鱼丸怎么换钱-2019 必知的 10 大尖端 python 库

admin 2019-11-20 177人围观 ,发现0个评论

雷锋网 AI 科技谈论按,作为数据科学和机器学习相关的研讨和开发人员,咱们每天都要用到 python。在本文中,咱们将评论一些 python 中的尖端库,开发人员可以运用这些库在现有的运用程序中运用、清洗和表明数据,章鱼彩票鱼丸怎么换钱-2019 必知的 10 大尖端 python 库并进行机器学习研讨。

咱们将评论以下 10 个库:

  1. TensorFlow

  2. Scikit-Learn

  3. Numpy

  4. Keras

  5. PyTorch

  6. LightGBM

  7. Eli5

  8. SciPy

  9. Theano

  10. Pandas

简介

python 是最盛行和运用最广泛的编程言语之一,它现已替代了业界许多编程言语。

python 在开发人员中盛行的原因有许多。可是,最重要的一点是它有许多的库供用户运用。

python 的简略性招引了许多开发人员为机器学习创立新的库。由于有许多的库,python 在机器学习专家中变得十分盛行。

所以,这儿要介绍的第一个库是 TensorFlow。

1.TensorFlow

什么是 TensorFlow?

假如你现在正在运用 python 进行机器学习项目,那么你或许听说过这一个盛行的开源库,那便是 TensorFlow。

这个库是由 Google 与 Brain Team 合作开发的,简直每一个 Google 的机器学习运用程序都用到了 TensorFlow。

TensorFlow 就像一个核算库,用于编写触及许多 tensor 操作的新算法。由于神经网络可以很简略地表明为核算图,因而它们可以运用 TensorFlow 作为 tensor 的一系列操作来完成。别的,tensor 是表明数据的 n 维矩阵。

TensorFlow 的特征

1.快速呼应的结构

运用 TensorFlow,咱们可以很简略地可视化图的每个部章鱼彩票鱼丸怎么换钱-2019 必知的 10 大尖端 python 库分,这在运用 Numpy 或 SciKit 时是做不到的。

2.灵敏

TensorFlow 的一个十分重要的特性是,它的操作十分灵敏。这意味着它具有模块性,可以让你把期望独立出来的部分分出来

3.简略练习

关于分布式核算来说,它很简略在 CPU 和 GPU 上练习。

4.并行神经网络练习

TensorFlow 供给了管道流,从这个意义上说,你可以练习多个神经网络和多个 GPU,这使得模型在大型体系上十分有用。

5.大型社区

不用说,它是由 Google 开发的,现已有一个巨大的软件工程师团队在不断地改善稳定性。

6.开源

这个机器学习库最好的一个特征是,它是开源的,任何人只需有衔接互联网就可以运用它。

TensorFlow 被用在哪里?

你每天都在运用 TensorFlow,你运用的 Google Voice Search 或 Google Photos 等运用程序都是运用这个库开发的。

在 TensorFlow 创立的一切库都是用 C 和 C++编写的,可是,它有一个杂乱的前端,是用 python 完成的。你的 python 代码将被编译,然后在运用 C 和 C++构建的 TensorFlow 分布式履行引擎上履行。

实践上,TensorFlow 的运用是无限的,这便是它美好的当地。

2.Scikit-Learn

什么是 Scikit-Learn?

它是一个与 NumPy 和 SciPy 相关联的 python 库。它被认为是处理杂乱数据的最佳库之一。

在这个库中进行了许多修正。其间一个修正是穿插验证特性,它供给了运用多个衡量的才能。许多练习办法,如物流回归和最附近算法,都没有得到什么改善。

Scikit-Learn 的特性

  1. 穿插验证:有多种办法可以查看不行见数据上受监督模型的精确性。

  2. 无监督学习算法:相同,在产品中有许多的算法——从聚类、因子剖析、主成分剖析到无监督神经网络

  3. 特征提取:用于从图画和文本中提取特征(例如一段文字)

Scikit Learn 被用在哪里?

它包含许多完成标准机器学习和数据发掘使命的算法,如降维、分类、回归、聚类和模型挑选。

3.Numpy

什么是 Numpy?

Numpy 被认为是 python 中最盛行的机器学习库之一。

TensorFlow 和其他库在内部运用 Numpy 对 tensor 履行多个操作。数组接口是 Numpy 的最佳和最重要的特性。

Numpy 的特性

  1. 交互性:Numpy 十分简略了解和运用

  2. 数学性:使杂乱的数学完成变得十分简略

  3. 直观:真正使编码变得简略,把握概念也很简略

  4. 许多接口:广泛运用,因而有许多开源贡献者

Numpy 被用在哪里?

该接口可用于将图画、声响和其他二进制原始流表明为 n 维实数数组。

机器学习库的完成,具有 Numpy 的常识关于全栈开发人员来说是很重要的。

4.Keras

什么是 Keras?

Keras 被认为是 python 中最酷的机器学习库之一。它供给了一种更简略表达神经网络的机制。Keras 还为编译模型、处理数据集、章鱼彩票鱼丸怎么换钱-2019 必知的 10 大尖端 python 库图形可视化等供给了一些最佳有用程序。

在后端,Keras 在内部运用 Theano 或 TensorFlow。也可以运用一些最盛行的神经网络,如 CNTK。当咱们将其与其他机器学习库进行比较时,Keras 的速度相对较慢,由于它运用后端根底设施创立核算图,然后运用它履行操作。Keras 的一切模型都很轻简。

Keras 的特征

  • 它在 CPU 和 GPU 上都能顺畅运转。

  • Keras 支撑简直一切的神经网络模型——全衔接、卷积、池化、循环、嵌入等。此外,这些模型可以结合起来构建更杂乱的模型。

  • Keras 本质上是模块化的,具有难以置信的表现力、灵敏性和立异性研讨的才能。

  • Keras 是一个彻底根据 python 的结构,它使调试和探究变得简略。

Keras 被用在哪里章鱼彩票鱼丸怎么换钱-2019 必知的 10 大尖端 python 库?

你现已在不断地与运用 Keras 构建的产品进行交互—Netflix、Uber、Yelp、Instacart、Zocdoc、Square 和许多其他公司都在运用它。它在草创企业中特别受欢迎,草创企业将深度学习放在其产品的中心方位。

Keras 包含许多常用的神经网络构建块的完成,例如层、方针、激活函数、优化器和一系列东西,以使图画和文本数据的处理愈加简略。

此外,它还供给许多预处理的数据集和预练习的模型,如 MNIST, VGG, Inception, SqueezeNet, ResNet 等。

Keras 也是深度学习研讨人员的独爱。大型科学安排,特别是 CERN and NASA 的研讨人员特别偏心 Keras。

5.PyTorch

什么是 PyTorch?

PyTorch 是最大的机器学习库,它答应开发人员以 GPU 的加速度履行 tensor 核算,创立动态核算图,并主动核算梯度。除此之外,PyTorch 还供给了丰厚的 API 来处理与神经网络相关的运用程序问题。

这个机器学习库是根据 Torch 的,它是一个用 C 言语完成的开源机器库,在 Lua 中进行了封装。

此机器学习库(python)于 2017 年推出,自其面世以来,该库越来越受欢迎,并招引了越来越多的机器学习开发人员。

PyTorch 的特性

  • 端到端 Hybrid

一种新的混合前端,供给了易于运用和具有灵敏性的 Eager Mode,一同为了速度,无缝过渡到 graph mode,在 C++运转环境中十分有用。

  • 分布式练习

运用本地支撑异步履行团体操作和点对点通讯(Python 和 C++),优化研讨和出产中的功用。

  • python 优先

PyTorch 不是一个将 python 绑定到 C++结构的东西。它的构建是为了深化集成到 python 中,以便可以与盛行的库和包(如 Cython 和 Numba)一同运用。

  • 库和东西

一个由研讨人员和开发人员组成的活泼社区现已建立了一个丰厚的东西和库的生态体系,用于扩展 PyTorch 并支撑从核算机视觉到强化学习等范畴的开发。

PyTorch 被用在哪里?

PyTorch 首要用于自然言语处理等范畴的运用程序。

它首要是由 Facebook 的人工智能研讨小组开发的,Uber 的概率编程软件「Pyro」就建立在它的根底之上。

PyTorch 在许多方面都优于 TensorFlow,最近它得到了许多重视。

6.LightGBM

什么是 LightGBM?

梯度增强是最好的和最盛行的机器学习(ML)库之一,它可以协助开发人员运用从头界说的根本模型,即决策树来构建新的算法。因而,有专门的库可以快速有用地完成这种办法。

这些库包含 LightGBM, XGBoost 和 CatBoost。这些库之间存在相互竞争的联系,它们都有助于处理常见问题,可以以简直相似的办法运用。

LightGBM 的特征

  • 核算速度快,出产功率高。

  • 直观,易于运用。

  • 比其他许多深度学习库更快地练习。

  • 在遇到 NaN 值和其他标准值时不会发生过错。

LightGBM 被用在哪里?

这个库供给了高度可扩展、优化和快速的梯度增强完成,这使得它在机器学习开发人员中很受欢迎。大多数机器学习全栈开发人员经过运用这些算法赢得了机器学习比赛。

7.Eli5

什么是 Eli5?

一般,机器学习模型猜测的成果并不精确,python 内置的机器学习库 Eli5 有助于战胜这一应战。它是可视化和调试一切机器学习模型的组合,并盯梢算法的一切作业进程。

Eli5 的特征

此外,Eli5 还支撑其他库,包含 xgboost、lightning、scikit-learn 和 sklearn-crfsite。一切上述库中额每一个都可以履行不同的使命。

Eli5 被用在哪里?

  • 在短时刻内需求进行许多核算的数学运用

  • Eli5 在和其他 Python 包存在依靠联系的状况下发挥着至关重要的效果

  • 在各个范畴的传统运用程序完成新办法

8.SciPy

什么是 SciPy?

SciPy 是一个面向运用程序开发人员和工程师的机器学习库。可是,你依然需求知道 SciPy 库和 SciPy 仓库之间的差异。SciPy 库包含用于优化、线性代数、集成和核算的模块。

SciPy 的特征

SciPy 库的首要特征是它是运用 Numpy 开发的,它的数组充分运用了 Numpy。

此外,SciPy 还运用其特定的子模块供给了一切有用的数值程序,如优化、数值积分和许多其他程序。

一切 SciPy 子模块中的一切功用都有详细的文档注释。

SciPy 被用在哪里?

SciPy 是一个运用 Numpy 来解数学函数的库。SciPy 运用 Numpy 数组作为根本数据结构,并顺便用于科学编程中各种常用使命的模块。

SciPy 可以轻松地处理线性代数、积分(微积分)、常微分方程求解和信号处理等使命。

9.Theano

什么是 Theano?

Theano 是一个用于核算多维数组的核算结构机器学习库。它的作业原理与 TensorFlow 相似,但不如 TensorFlow 有用,由于它无法习惯出产环境。

此外,Theano 也可以在与 TensorFlow 相似的分布式或并行环境中运用。

Theano 的特征

  • 与 Numpy 严密集成——可以在无编译函数中运用完好的 Numpy 数组

  • 高效地运用 GPU——比 CPU 履行数据密集型核算要快得多

  • 有用的符号区别——Theano 为具有一个或多个输入的函数求导数

  • 速度和稳定性优化——即便在 x 十分小的状况下,也能求出 log(1+x)的正确答案。这仅仅一个可以证明 Theano 稳定性的比如

  • 动态 C 代码生成——比曾经更快地评价表达式,然后大大提高功率

  • 广泛的单元测试和自验证—检测和诊断模型中多种类型的歧义和过错

Theano 被用在哪里?

Theano 表达式的实践语法是符号化的,这关于习惯于惯例软件开发的初学者来说是很不便利的。隔夜茶能喝吗详细来说,表达式是以笼统的办法界说、编译的,然后直接用于核算。

它是专门为处理深度学习运用的大型神经网络算法所需的核算而规划的。它是同类库中最早的一个(在 2007 年就开端开发了),被认为是深度学习研讨和开发的行业标准。

Theano 现在正被用于多个神经网络项目中,并且跟着时刻的推移,Theano 的普及率也在不断提高。

20.Pandas

什么是 Pandas?

Pandas 是 Python 中的一个机器学习库,它供给高档的数据结构和各式各样的剖析东西。这个库的一个重要特性是可以运用一个或两个指令转化杂乱的数据操作。Pandas 有许多内置的分组、数据组合、过滤和时刻序列功用的函数。

Pandas 的特征

Pandas 保证了整个数据处理的进程愈加简略。对比如重索引、迭代、排序、聚合、衔接和可视化等操作的支撑是 Pandas 的特征亮点之一。

Pandas 被用在哪里?

现在,Pandas 库的版别较少,其间包含数百个新功用、过错修正、增强和 API 更改。Pandas 的改善在于它可以对数据进行分组和排序,为运用的办法挑选最适合的输出,并为履行自界说类型的操作供给支撑。

当运用 Pandas 的时分,数据剖析占了很大的比重。可是,当与其他库和东西一同运用时,Pandas 保证了高功用和杰出的灵敏性。

python 中的 10 大尖端 机器学习库的介绍就到这儿啦,期望本文可以协助你开端学习 python 中可用的库。

Via:https://dzone.com/articles/top-10-python-libraries-you-must-know-in-2019

雷锋网雷锋网

请关注微信公众号
微信二维码
不容错过
Powered By Z-BlogPHP