罗威纳,matter,跑车排行榜

数据锦衣佞臣和分析为数字化转型提供了燃料,而企业充分发挥这些燃料的唯一途径是,为其统计学家、数据专家和企业分析专家提供正确的数据科学工具,从而为企业提供宝贵的洞察力。

上海数据分析网

无论是用于直接统计分析、机器学习建模还是可视化,数据科学工具对于建设数据驱动的企业文化都至关重要。

最近我们采访了各个行业中经验丰富的数据科学家,询问他们最常使用的工具。下面是我们从中精心挑选的 5 个监督不行届工具。

Python

上海数据分析网

与用于创建自定义算法的编程方法不同,Python 不是一种独特的软件,但它是很多数据科学家的首选。在最近数据科学网站 KDnuggets 对 2052 名用户进行的分析 / 数据科学软件调查中,Python 被 65.6% 的受访者列叶月绚音为首选工具。

Cindicator 公司首席数据科学家 Alexander Osipenko 表示:“我们将 Python 用于数据科学和后端,这为我们提供了快速开发和机器学习模型部署。对于我们来说,同样重要的是确保部署工具的安全性。”

Katie Malone 最初是一名粒子物理学家,现在她是 Civis Analystic 公司的数据科学研究团队的负责人之一,她指出,Python 是她作为物理学家首选的数据科学工具,而现在她在商业世界也在继续使用它。对于她而言,吸引她的是围绕 Python 强大的开源生态系统,这使她能够利用各种数据科学库来帮助她解决特定的分析问题。

她表示:“这个社区拥有非常充满活力的开源人群,他们使用 Python 来解决有趣的数据科学问题。”

Wovenware 公司创新总监兼首席数据科学家 Leslie De Jesus 对此表示赞同,她非常依赖 Python 库。

“我们使用 Python 库 (包括 S千芳汇crapy) 用于网络抓取,并能够从互联网上提取数据并将其上传到数据框架进行分析,”De Jesus 说。 “同时,我们使用 Pandas 和 NumPy Python 库进行数据分析和矩阵操作。这些都有助于我们更快创建代码,而 NumPy 还允许复杂的广播功能。”

Tiger Analytics 公司数据科学和创新主管 Niranjan Krishnan 解释说,Python 的用例非常多。

Krishnan 说:“我们已经成功部署 Python 数据科学模型,用于优化直接面向客户的营销活动和人寿保险承保,以及改善在线广告的实时定价。”

这里的缺点是,Python 是基于代码,这里需要高水平的编程和分析技能。

他指出:“而 Knime 和 Alteryx 是好的菜单驱动的低代码替代品,也可供一般数据科学家和业务分析师使用。”

R

上海数据分析网

与 Python 类似,R 是很多数据科学专业人员喜爱的另一种编程语言,它cz6630更加简单且更专注于数据科学。在 KDnuggets 调查中,R 排名第三,48.5% 的受访者将其列为首选数据科学工具之一奇书色医。

Civis Analytics 公司的 Malone 表示,R 具有非常复杂的机器学习和我的兄弟情人第二季统计功能,这是她的团队成员除 Python 之外的常用选择。

她指出:“这取决于具体情况,我们有多种需求,所以这两个我们都喜欢。从统计和定量社会科学方面桑拿按摩来看,R 更多一些。”

根据 Untapt 杀杀草纸公司首席数据科学家 Jon Krohn 的说法,R 是他的首选数据探索工具。

他指出:“我可以快速查看平均值、中位数和四分位数等摘要统计数据; 快速创建不同的图表; 以及创建测试数据集,这些可轻松地共享并导出位 CS94coocV 格式。”

Jupyter Notebook

上海数据分析网

从数据可视化和数据通信来看,很多数据科学团队的数据科学工具列表中还会有 Jupyter Notebook。

HackerRank 公司数据科学副总裁 SofusMacskssy 表示:“Jupyter Notebook 支持 R 和 Python,对数据访雪海林原问和可视化提供强大库支持。该工具还使团队能够轻松导出工作簿用于演示,它正成为数据科学领域的标准。”

对于 Anexinet 公司数字和分析服务高级副总裁 Michael Golub 而言,Jupyter 的另一个好处是,可灵活使用受欢迎的数据科学库。Golub 解释说 Jupyter 是他团队罗威纳,matter,跑车排行榜喜欢的协作开发环境。

Golub特务仙师 称:“Jupyter Notebook 是我们协作数据科学项目工作的工具,在涉及需要教育的时候,它也非常有用。”

此外,Untapt 公司的 Krohn 称,Jupyter Notebook 是交互式构建原型模型的工具。

他表示:“在 Untapt,我们利用 Jupyter Notebook 来编写原型代码,也用于打印数据抠脚大叔表、摘要指标和图表。”

Tableau

tableau

在硬数据科学团队和更多以业务为中心的分析人员之间,Tableau 我的绝美校花老婆可提供良好的桥梁。

Entersoft Security 公司的 SEO 高级主管 Pooja Pandey 表示:“对于数据科学家和数据科学新手来说,这是很棒的工具。这是一个快速仪表板工具,可毕庆堂提供可视化洞察力和分析数据,它有着非常短的学习曲线。”

Tableau 的可视化和报告功能的速度可为各项羽帐下五大将种用户提供洞察力。

QuotesAdvisor.com 首席执行官 Sophie Miles 表示:“它可以很快部署、易于学习且非常直观。通过 Tableau,该公司的不同部门可根据需要制定详尽的报告。

Miles 解释称,由于该仪表板非常灵活,因此对数据组合的临时请求数量有所减少。因此,QuotesAdvisor.com 的效率提高了 95%。她说道:“现在人们花更多的时间来思考问题,而不是生成报告。”

Keras

Keras

根据日立 Vantara 公司首席技术官办公室首席数据科学家 Wei Lin 表示,他常用的数据科学工具是 Python、R 和 Keras。他使用 Python 和 R 用于上述所有原因,而利用 Keras 的深度学习功能。

Lin 称:“Keras 是使用 Python 编写的开源神经网络库,以快速通过深度神经网络进行实验。并且,它能够运行在 TensorFlow、微软 Cognitive Toolkit 或 Thea。”

Kera 的优势在于高维模式匹配。

他表示:“例如,图像和自然语言处理以及支持完善的深度学习分析模型,包括卷积神经网络和短期记忆。”

根据仙风稻妻 Cindicator 公司的 Osipenko 表示,Keras 的最大吸引点在于它可帮助节省大量时间。

他指出:“我们添加新工具的主要标准是,它是否能让你作为数据科学家的工作变得更轻松。这里秦家有兽的例孙云奇子就是 Keras,这个开源高级包装器,可大大加快开发神经网络的过程。任何在 TensorFlow 编写神经网络的人都会明白我在说什么。即使 Keras 不完美,但它可以改变这个开发流程,让你的代码对其他开发人员更具可读性。”