互操作性
这件事情是由很多原因导致的:
使用R和Python努力合作的数据科学团队并与利益相关者一致分享他们的工作。阅读更多
BI和数据科学团队被困在筒仓中,未能合作,甚至争夺资源和执行思维。阅读更多
数据科学工作被困在本地硬件上,并且不整合到组织的云战略中。阅读更多
分析团队难以访问和将所有数据合并在可再现的数据管道中。这些数据可以以结构化,非结构化和非传统数据源的形式分布在Excel文件,公司数据源和云中。阅读更多
数据科学团队发现很难利用DevOps/IT提供的作业管理系统。这些系统是使用Kubernetes和Slurm等框架构建的,可能会闲置,而数据科学团队则很难找到创建见解所需的计算能力。阅读更多
数据科学见解被卡在笔记本电脑上,而不是支持推动组织决策的人类和自动化的工作流。阅读更多
通过采用严重的数据科学,开源,代码优先,根据Rstudio的专业产品进行扩展和管理,您的组织可以履行您的分析投资的承诺价值。
Eli Lilly and Company的研究科学家Eric Nantz在Rstudio :: Conf 2020谈到R. R.互操作性的重要性。
利用所有数据
访问,转换和组合所有数据,该数据是针对您的特定应用程序量身定制的
根据Forrester最近的一份报告,“轶事证据表明,所有可用于推动可行见解的企业数据中,不超过20%的目的。”((福雷斯特Boris Evelson和Cinny Little的报告)。
分析团队很难在可再现的数据管道中访问和组合所有数据,尤其是当这些数据分布在Excel文件,公司数据源和云中时,以结构化,非结构化和非传统数据源的形式(例如Web刮擦)。
Rstudio的开源,代码优先的方法为您提供了利用所有数据并构建可重复性数据管道的访问和灵活性,以满足所有分析要求。
用kubernetes,slurm等缩放
从您熟悉的开发工具中使用所有可用的计算资源
SPARK或KUBERNETES等分析基础架构需要大量资源来设置和维护。如果数据科学家必须留下本机工具来访问此基础架构,则他们必须切换上下文并记住如何使用系统可能很少触摸的系统。通常,这意味着它们不会完全利用可用的资源,从而导致这些资源未被充分利用。
通过从语言和开发环境中提供对这些工具的本地访问数据,科学家每天都使用数据,科学家可以在不需要切换上下文的情况下利用这些工具。数据科学家获得所需的计算功率,同时更好地利用IT资源。这种更高的利用有助于组织从这些分析投资中获得预期的ROI。
通过API整合您的数据科学
直接提供您的数据科学洞察力,它们增加价值
一旦创建了预测模型或其他分析,就有许多不同的方法可以共享该分析,以便产生影响。数据科学家可以
但是,共享分析的最可扩展方法之一是创建API。API可以赋予与统计模型和分析结果的实时交互能力。这使组织内部或外部的其他开发人员能够直接与已经完成的工作直接集成并建立不需要昂贵的重新实现的工作。
更多的可能性
与其他建模环境,git,ci/cd工作流程集成在一起
使用开源R和Python的最大好处之一是这些环境提供的大量集成选项。不断地由社区或Rstudio等供应商不断添加新的集成。
因此,任何集成点的清单都无法真正全面,但是您可以确信,如果您需要将R或Python集成到另一个系统中,那么其他人很可能已经为您解决了问题。
RSTUDIO固有的工具使我们的统计学家和数据科学家能够在不学习任何新语言或计算机科学技能的情况下变成应用程序开发人员和数据工程师。”
保罗·迪特林(Paul Ditterline),棕色形式
阅读全文这里。