各种规模的组织都将云服务用于数据科学,以减轻挑战,例如:

  • 长时间延误和高创业成本对于新项目和新数据科学团队
  • 协作的障碍组织或团体之间
  • 计算基础架构的高成本,包括硬件,软件和人力
  • 缩放难度满足可变需求
  • 时间和费用过多将数据移至分析

根据您的数据科学需求选择您的云策略

根据组织的情况以及您要解决的具体挑战,需要考虑多个云选项:

  • 托管和软件作为服务(SaaS)产品:
    完全托管的服务,例如bwin 网址 ,可以最大程度地减少启动新项目,研讨会或课程所需的成本和时间。
  • 部署到虚拟私有云(VPC)提供商:
    在主要的云平台(例如Amazon Web Services(AWS)或Azure)上部署软件可以提供前提软件的全部灵活性和自定义。
  • 云市场产品:
    在Amazon Sagemaker和Azure ML等服务等服务上提供的预先构建的申请。使以每小时付费的费用轻松开始,但需要仔细管理以确保软件可用并仅在需要时运行。
  • 完全管理的服务:
    这些产品(例如Amazon Sagemaker上的Rstudio)提供了云的便利性和可扩展性,同时将维护和管理卸载给云提供商或第三方。
  • 数据湖的数据科学:
    通过将您的数据科学工具嵌入现有数据平台中,您的计算可以接近数据,最小化开销,并轻松地将其绑在数据管道中。

想了解更多吗?

Rstudio支持您的数据科学云策略

无论您选择哪种方法,Rstudio都提供多种选择来支持您的云旅程:

通过SaaS解决方案简化和降低启动成本:

促进组织和团体之间的协作和指导

减轻计算基础架构的高成本

扩展以满足可变需求。除上述选项(市场,全面服务,VPC,Docker和Cloud Storage)外,Rstudio的Pro产品还提供了特定功能来帮助:

  • Rstudio Workbench的发射器与Kubernetes集成,这是一种行业标准的聚类解决方案,可有效缩放
  • Rstudio提供舵图帮助您管理Kubernetes配置
  • rstudio connect提供了许多选择尺度和曲调表现,包括成为自动化小组的一部分。这些选项允许连接以将仪表板,闪亮的应用程序和其他类型的内容交付给大量用户

最小化数据移动。通过运行接近数据的计算,您可以最大程度地减少开销并将数据科学直接绑定到数据管道中:

  • 在您的云提供商上运行数据科学工具,无论是在市场,完全管理的服务还是上面列出的VPC中,以帮助最大程度地减少数据移动
  • 天然R接口到火花:Sparplyr允许您轻松使用过滤和聚集Spark数据集和流,然后将它们带入R进行分析和可视化,以大规模训练模型并在Spark中生产机器学习管道。在Spark上了解更多
  • 连接到基于云的数据存储,例如雪花,红移或S3Rstudio专业司机
  • 利用Amazon EFS(弹性文件系统)作为您为Rstudio团队共享的文件系统

更多资源:

  • 阅读博客post,“ Rstudio适合您的云旅程”
  • 手表网络研讨会,“为什么在云中数据科学?”
  • 学习更多关于bwin 网址 ,您可以免费开始的地方,或检查我们可用计划。如果您有兴趣使用Rstudio Cloud进行教学,请观看网络研讨会,“用rstudio云在线教授r”
与rstudio建立电话

同龄人的Rstudio云故事

Baidu
map