大多数组织都在多种分析工具的复杂性上挣扎,并且无法从其数据中获得全部价值。

这件事情是由很多原因导致的:

R和Python

使用R和Python努力合作的数据科学团队并与利益相关者一致分享他们的工作。阅读更多

BI和数据科学

BI和数据科学团队被困在筒仓中,未能合作,甚至争夺资源和执行思维。阅读更多

云中的rstudio

数据科学工作被困在本地硬件上,并且不整合到组织的云战略中。阅读更多

利用您的数据

分析团队难以访问和将所有数据合并在可再现的数据管道中。这些数据可以以结构化,非结构化和非传统数据源的形式分布在Excel文件,公司数据源和云中。阅读更多

Kubernetes

数据科学团队发现很难利用DevOps/IT提供的作业管理系统。这些系统是使用Kubernetes和Slurm等框架构建的,可能会闲置,而数据科学团队则很难找到创建见解所需的计算能力。阅读更多

通过API集成

数据科学见解被卡在笔记本电脑上,而不是支持推动组织决策的人类和自动化的工作流。阅读更多

想了解更多吗?

Rstudio的模块化平台可以补充您的其他分析投资,并帮助您最大化数据的价值

通过采用严重的数据科学,开源,代码优先,根据Rstudio的专业产品进行扩展和管理,您的组织可以履行您的分析投资的承诺价值。

Eli Lilly and Company的研究科学家Eric Nantz在Rstudio :: Conf 2020谈到R. R.互操作性的重要性。

通过杠杆数据的强度

利用所有数据
访问,转换和组合所有数据,该数据是针对您的特定应用程序量身定制的

根据Forrester最近的一份报告,“轶事证据表明,所有可用于推动可行见解的企业数据中,不超过20%的目的。”((福雷斯特Boris Evelson和Cinny Little的报告)。

分析团队很难在可再现的数据管道中访问和组合所有数据,尤其是当这些数据分布在Excel文件,公司数据源和云中时,以结构化,非结构化和非传统数据源的形式(例如Web刮擦)。

Rstudio的开源,代码优先的方法为您提供了利用所有数据并构建可重复性数据管道的访问和灵活性,以满足所有分析要求。

  • 数据访问:RSTUDIO的专业数据库驱动程序是最受欢迎的数据损害的ODBC数据连接器。这些驱动程序将帮助您探索数据,向利益相关者部署数据驱动的交互式应用程序,并使用R。学到更多
  • 使用数据库的最佳实践:rstudio使得通过我们的产品易于使用数据库,并就最佳实践提供建议。了解更多信息db.rstudio.com
  • 本机和可扩展的R接口引发:Sparplyr允许您轻松过滤和聚集Spark数据集和流以将它们带入R进行分析和可视化,以大规模训练模型,并在Spark中生产机器学习管道。所有这些都可以使用熟悉的R工具(例如DPLYR,DBI,扫帚和欧洲防风草)完成。闪闪发光是可扩展的,可以将功能扩展到特定领域,例如时间序列和地理空间分析。了解更多信息spark.rstudio.com
  • 开源的力量: 这平淡无奇包装的收集提供了一种一致,直观,低的代码方式,可访问,组合和转换您的数据,使数据科学更容易学习和完成。与dplyr软件包,您可以使用相同的语法在内存中转换数据,在数据库中,,,,在火花中, 和更多。
  • 可再现的数据管道:创建数据管道后,您可以使用可重复的rmarkDown文档进行文档,并安排其定期运行rstudio connect。学习更多关于安排数据科学任务
扩展您的工作

用kubernetes,slurm等缩放
从您熟悉的开发工具中使用所有可用的计算资源

SPARK或KUBERNETES等分析基础架构需要大量资源来设置和维护。如果数据科学家必须留下本机工具来访问此基础架构,则他们必须切换上下文并记住如何使用系统可能很少触摸的系统。通常,这意味着它们不会完全利用可用的资源,从而导致这些资源未被充分利用。

通过从语言和开发环境中提供对这些工具的本地访问数据,科学家每天都使用数据,科学家可以在不需要切换上下文的情况下利用这些工具。数据科学家获得所需的计算功率,同时更好地利用IT资源。这种更高的利用有助于组织从这些分析投资中获得预期的ROI。

  • Rstudio工作台允许数据科学家使用其首选的开发环境(RSTUDIO IDE,JUPYTER或VS CODE),同时通过RSTUDIO Job Launcher利用Kubernetes或Slurm群集中IT管理的计算资源。学习更多关于Rstudio工作台,以及我们对Kubernetes浆液
  • 本机和可扩展的R接口引发:Sparplyr允许您轻松过滤和聚集Spark数据集和流以将它们带入R进行分析和可视化,以大规模训练模型,并在Spark中生产机器学习管道。所有这些都可以使用熟悉的R工具(例如Dplyr,DBI,Bloom和Parsnip)完成。闪闪发光是可扩展的,可以将功能扩展到特定领域,例如时间序列和地理空间分析。了解更多信息spark.rstudio.com
  • Docker部署:Rstudio产品可以在容器和Kubernetes中运行,因此可以将其集成到组织标准DevOps框架中。学到更多
  • 与您自己的工作调度系统集成:带有RSTUDIO启动器插件SDK。如果您的要求超出了Slurm和Kubernetes,则该SDK使开发人员可以为RSTUDIO Job Launcher编写插件,以使用C/C ++的自定义作业调度系统。学到更多
蜜蜂

通过API整合您的数据科学
直接提供您的数据科学洞察力,它们增加价值

一旦创建了预测模型或其他分析,就有许多不同的方法可以共享该分析,以便产生影响。数据科学家可以

  • 准备并向业务利益相关者提供演讲。
  • 创建一个可重现的报告,该报告被广泛共享和分发。
  • 开发并共享交互式仪表板或应用程序,以便在方便的情况下为他人提供对分析结果和发现的自助服务访问。

但是,共享分析的最可扩展方法之一是创建API。API可以赋予与统计模型和分析结果的实时交互能力。这使组织内部或外部的其他开发人员能够直接与已经完成的工作直接集成并建立不需要昂贵的重新实现的工作。

  • rstudio connect允许您的数据科学家与您的决策者共享基于R或Python的报告,仪表板,应用程序和API。学到更多
  • API简介:API是您的数据科学家可以增加分析影响的几种方法之一。学到更多
  • R API带水管工:Plumber软件包允许您轻松地从现有的R源代码创建Web API。观看网络研讨会, 或者见示例
  • Python Apis,带烧瓶,Fastapi,夸脱,猎鹰,理性:同样,有多个框架使您可以从现有的Python模型中创建Web API,可以在Rstudio Connect上部署。学到更多
  • TensorFlow模型API:保存的TensorFlow模型也可以在Rstudio Connect上的API部署。学到更多
  • 将API与您的分析应用程序集成:一旦拥有API,就可以轻松地将这些API集成到现有应用程序中。RSTUDIO提供了将API集成到R,Python,Java或其他语言和系统中的示例代码。学到更多

更多的可能性
与其他建模环境,git,ci/cd工作流程集成在一起

使用开源R和Python的最大好处之一是这些环境提供的大量集成选项。不断地由社区或Rstudio等供应商不断添加新的集成。

因此,任何集成点的清单都无法真正全面,但是您可以确信,如果您需要将R或Python集成到另一个系统中,那么其他人很可能已经为您解决了问题。

  • git:RSTUDIO IDE允许您直接使用存储在远程GIT存储库中的代码。您还可以将内容发布到Rstudio直接从远程GIT存储库连接,并使用RSTUDIO软件包管理器构建存储在远程Git存储库中的R软件包。学到更多
  • 与CI/CD过程集成:按钮发布,GIT部署和API支持的发布提供了多种选择,以与您组织的现有CI/CD流程保持一致。学到更多
  • 深度学习:rstudio还为本机R接口提供TensorFlow,,,,凯拉斯, 和火炬,使R用户能够从其首选的R和Python中利用这些深度学习框架。
  • 可重现的R Markdown文档带有多种语言:除了R和Python外,R Markdown还允许您在单个笔记本中组合多种分析语言,包括用于访问数据库的SQL代码,使用RCPP软件包的Shell脚本,C和C ++代码的BASH代码,与RSTAN一起使用RSTAN代码,用于Bayesian for Bayesian建模,用于执行Web编程的JavaScript以及更多语言。学到更多
  • 解决方案网站:RSTUDIO解决方案工程团队维护Solutions.rstudio.com网站,其中包括广泛的文章参考体系结构,,,,产品集成模型管理的提示学到更多

RSTUDIO固有的工具使我们的统计学家和数据科学家能够在不学习任何新语言或计算机科学技能的情况下变成应用程序开发人员和数据工程师。”

保罗·迪特林(Pau​​l Ditterline),棕色形式
阅读全文这里

Baidu
map