新闻资讯  快讯  焦点  财经  政策  社会
互 联 网   电商  金融  数据  计算  技巧
生活百科  科技  职场  健康  法律  汽车
手机百科  知识  软件  修理  测评  微信
软件技术  应用  系统  图像  视频  经验
硬件技术  知识  技术  测评  选购  维修
网络技术  硬件  软件  设置  安全  技术
程序开发  语言  移动  数据  开源  百科
安全防护  资讯  黑客  木马  病毒  移动
站长技术  搜索  SEO  推广  媒体  移动
财经百科  股票  知识  理财  财务  金融
教育考试  育儿  小学  高考  考研  留学
您当前的位置:首页 > IT百科 > 人工智能

21 个必须知道的机器学习开源工具

时间:2019-12-04 11:31:37  来源:  作者:
21 个必须知道的机器学习开源工具

作者 | SebastianScholl

译者 | 刘静,责编 | 郭芮

出品 | CSDN(ID:CSDNnews)

以下为译文:

你肯定已经了解流行的开源工具,如R、Python、Jupyter笔记本等。但是,除了这些流行的工具之外还有一个世界——一个隐藏在机器学习工具下的地方。这些并不像他们的同行那样出色,但可以成为许多机器学习任务的救星。

21 个必须知道的机器学习开源工具

在本文中,我们将介绍21种用于机器学习的开源工具。我强烈建议你花一些时间浏览我提到的每个类别。除了我们通常在课程和视频中学到的东西之外,还有很多需要学习的地方。

1.向非程序员的开源机器学习工具

对于来自非编程和非技术背景的人来说,机器学习看起来很复杂。这是一个广阔的领域,我可以想象第一步可能会多么令人生畏。没有编程经验的人能否在机器学习中取得成功?

事实证明,你可以!这里有一些工具可以帮助你跨越鸿沟并进入著名的机器学习世界:

  • 优步路德维希:路德维希允许我们训练和测试深度学习模型,而无需编写代码。您需要提供的只是一个包含数据的CSV文件,一个用作输入的列的列表,以及一个用作输出的列的列表——Ludwig将完成剩下的工作。

  • KNIME:KNIME允许您使用拖放界面创建整个数据科学工作流程。这种可视化实现整个模型工作流的方法非常直观,在处理复杂的问题陈述时非常有用。

21 个必须知道的机器学习开源工具
  • Orange:您不必知道如何编码以便能够使用Orange挖掘数据,处理数据并获得洞察力。

有许多有趣的免费和开源软件可以提供很好的机器学习功能,而无需编写(大量)代码。

另一方面,你可以考虑一些开箱即用的付费服务,例如Google AutoML、Azure Studio、Deep Cognition和Data Robot。
 

2.用于模型部署的开源机器学习工具

部署机器学习模型是最容易被忽视但重要的任务之一,它几乎肯定会在采访中出现,所以你可能也很熟悉这个话题。

以下是一些框架,可以更轻松地将你的项目部署到现实世界的设备中。

  • MLFlow:MLFlow被设计用于使用任何机器学习库或算法,并管理整个生命周期,包括实验、重现性和机器学习模型的部署。

21 个必须知道的机器学习开源工具
  • Apple的CoreML:CoreML是一个流行的框架,它可用于将机器学习模型集成到你的IOSApple Watch / Apple TV / macOS应用程序中。关于CoreML的最好的部分是你不需要有关神经网络或机器学习的广泛知识,双赢!

21 个必须知道的机器学习开源工具
  • TensorFlow Lite:TensorFlow Lite是一组工具,可帮助开发人员在移动设备(Android和iOS),嵌入式和物联网设备上运行TensorFlow模型。

  • TensorFlow.JS - TensorFlow.JS可以成为你在网络上部署机器学习模型的首选。它是一个开源库,可让你在浏览器中构建和训练机器学习模型。

21 个必须知道的机器学习开源工具
 

适用于大数据的开源机器学习工具

大数据是一个研究如何分析、系统地从数据集中提取信息,或者处理传统数据处理应用软件无法处理的太大或太复杂的数据集的领域。想象一下,每天处理数百万条推文进行情感分析。这是一项艰巨的任务,不是吗?

别担心!这里有一些工具可以帮助你处理大数据。

  • Hadoop:使用大数据最重要和最相关的工具之一是Hadoop项目。Hadoop是一个框架,它允许使用简单的编程模型跨计算机集群分布式处理大型数据集。

21 个必须知道的机器学习开源工具
  • Spark:Apache Spark被认为是Hadoop用于大数据应用程序的自然继承者。这个开源大数据工具的关键点在于它填补了Apache Hadoop在数据处理方面的空白。有趣的是,Spark可以处理批量数据和实时数据。

  • Neo4j:对于所有与数据相关的大问题,Hadoop可能不是明智的选择。例如,当你需要处理大量网络数据或图形相关问题(如社交网络或人口统计模式)时,图形数据库可能是最佳选择。

21 个必须知道的机器学习开源工具

4.用于计算机视觉,NLP和音频的开源机器学习工具

“如果我们想要机器思考,我们需要教他们看。”——Fei-Fei Li博士的计算机视觉。

  • SimpleCV:如果你从事任何计算机视觉项目,必须使用OpenCV。但你有遇到过SimpleCV吗?SimpleCV可以访问几个高性能的计算机视觉库,如OpenCV——无需首先了解位深度、文件格式、色彩空间、缓冲区管理、特征值或矩阵与位图存储,这使计算机视觉变得简单。

21 个必须知道的机器学习开源工具
  • Tesseract OCR:你是否使用过创意应用程序,通过使用智能手机的相机扫描文档或购物账单,或者仅仅通过给支票拍照就可以把钱存入银行账户?所有这些应用程序都称之为OCR或光学字符识别软件。Tesseract就是这样一种OCR引擎,能够识别100多种语言,也可以训练识别其他语言。

  • Detectron:Detectron是Facebook AI Research的软件系统,它实现了最先进的物体检测算法,包括Mask R-CNN。它是用Python编写的,由Caffe2深度学习框架提供支持。

21 个必须知道的机器学习开源工具
  • StanfordNLP:StanfordNLP是一个Python自然语言分析包,关于这个库的最好的部分就是它支持超过70种人类语言!

21 个必须知道的机器学习开源工具
  • BERT即服务:你们所有的NLP爱好者都会听说过BERT这一来自谷歌的突破性NLP架构,但你可能还没有遇到过这个非常有用的项目。Bert-as-a-service使用BERT作为句子编码器,并通过ZeroMQ将其作为服务托管,允许你仅用两行代码将句子映射到固定长度的表示形式。

  • Google Magenta:此库提供了用于处理源数据(主要是音乐和图像)的实用程序,使用此数据来训练机器学习模型,最后从这些模型生成新内容。

  • LibROSA:LibROSA是一个用于音乐和音频分析的Python包。它提供了创建音乐信息检索系统所需的构建块。当我们使用深度学习等语音到文本的应用程序时,它在音频信号预处理中被大量使用。



  •  

5.用于强化学习的开源工具

当谈到机器学习时,RL是最近的热门话题。强化学习(RL)的目标是培养能够与环境互动并解决复杂任务的智能代理,实现机器人、自动驾驶汽车等领域的实际应用。以下是一些对RL最有用的培训环境:

  • 谷歌研究足球:谷歌研究足球环境是一个新颖的RL环境,代理商的目标是掌握世界上最受欢迎的运动——足球。这种环境为你提供了大量的控制来训练RL代理。

  • OpenAI Gym:Gym是一个用于开发和比较强化学习算法的工具包。它支持教学代理从步行到玩乒乓球或弹球戏等游戏。在下面的gif图片中,你可以看到一个正在学习走路的机器人。

21 个必须知道的机器学习开源工具
  • Unity ML代理:Unity机器学习代理工具包(ML-Agents)是一个开放源码Unity插件,可以将游戏和模拟作为培训智能代理的环境。通过一个简单易用的Python API,可以使用强化学习、模仿学习、神经进化或其他机器学习方法来训练agent。

21 个必须知道的机器学习开源工具
  • Malmo项目:Malmo平台是一个基于Minecraft构建的复杂AI实验平台,旨在支持人工智能的基础研究,由Microsoft开发。

6.最后指出

正如上面的一组工具可以明显看出,当我们考虑数据科学和人工智能相关的项目时,开源是一条正确的道路。我可能只是触及了冰山一角,但是有许多工具可用于各种任务,使你作为数据科学家的生活更轻松,你只需要知道在哪里查找即可。

你认为哪些工具应该列在这个清单上?在下面写下你的最爱,以便社区了解!

原文:https://medium.com/analytics-vidhya/21-must-know-open-source-tools-for-machine-learning-you-probably-arent-using-but-should-f605b94d9b06

本文为 CSDN 翻译,转载请注明来源出处。

【END】



Tags:机器学习   点击:()  评论:()
声明:本站部分内容来自互联网,内容观点仅代表作者本人,如有任何版权侵犯请与我们联系,我们将立即删除。
▌相关评论
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
▌相关推荐
你肯定已经了解流行的开源工具,如R、Python、Jupyter笔记本等。但是,除了这些流行的工具之外还有一个世界——一个隐藏在机器学习工具下的地方。这些并不像他们的同行那样出色,但可以成为许多机器学习任务的救星。...【详细内容】
2019-12-04   机器学习  点击:(0)  评论:(0)  加入收藏
通过本篇文章可以对ML的常用算法有个常识性的认识,没有代码,没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的,例子主要是分类问题。每个算法都看了好几个视...【详细内容】
2019-11-25   机器学习  点击:(15)  评论:(0)  加入收藏
由于公司架构调整和业务方向的转变,我所在的项目组即将接手一个机器学习和数据挖掘的项目,为了后续更好地开展工作,也为了能提高自己的专业技能,我决定开始学习机器和数据挖掘方...【详细内容】
2019-09-02   机器学习  点击:(34)  评论:(0)  加入收藏
人工智能经过十几年的发展,已经取得不少成就,未来AI技术将对社会产生什么影响,又有什么趋势?全球机器学习之父、人工智能领域顶尖科学家,卡内基梅隆大学计算机学院院长Tom Mitche...【详细内容】
2019-08-29   机器学习  点击:(42)  评论:(0)  加入收藏
介绍想象一下-你已经在给定的数据集上训练了机器学习模型,并准备好将它交付给客户。但是,你如何确定该模型能够提供最佳结果?是否有指标或技术可以帮助你快速评估数据集上的...【详细内容】
2019-08-29   机器学习  点击:(95)  评论:(0)  加入收藏
本文列出了数据科学家使用的十大机器学习算法,并且介绍了这十大算法的特点,供各位机器学习的新人们更好地理解和应用。在机器学习领域,有种说法叫做“世上没有免费的午餐”,简而...【详细内容】
2019-08-22   机器学习  点击:(24)  评论:(0)  加入收藏
广义来说,有三种机器学习算法1、 监督式学习工作机制:这个算法由一个目标变量或结果变量(或因变量)组成。这些变量由已知的一系列预示变量(自变量)预测而来。利用这一系列变量,我们...【详细内容】
2019-08-12   机器学习  点击:(50)  评论:(0)  加入收藏
【猎云网(微信号:)】8月12日报道(编译:Liam)近年来,随着人类在计算能力上取得的巨大进步,以及新计算机算法的发现和标记数据的增加,人类对神经网络(一种具有学习能力的人工智能系统)的...【详细内容】
2019-08-12   机器学习  点击:(18)  评论:(0)  加入收藏
本章开始对学习进行讨论,首先介绍机器学习和解释归纳范式。决策树是广泛应用的归纳学习方法,由于它们不能很好泛化,预测能力很差,因此有大约10年的时间,它们都没有得到人们的支持...【详细内容】
2019-08-08   机器学习  点击:(33)  评论:(0)  加入收藏
机器学习人工智能,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎,而机器学习是人工智能的核心。“机器学习是一门人工智能的科学...【详细内容】
2019-07-15   机器学习  点击:(46)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条