各种规模的组织都使用云服务进行数据科学,以缓解以下挑战:

  • 延迟时间长,启动成本高用于新项目和新的数据科学团队
  • 合作的障碍组织或团体之间
  • 计算基础设施成本高,包括硬件、软件和人力
  • 扩展困难满足多变的需求
  • 过多的时间和成本将数据移动到分析中

根据您的数据科学需求选择您的云策略

根据您组织的环境以及您试图解决的具体挑战,可以考虑多种云方案:

  • 托管和软件即服务(SaaS)产品:
    完全托管的服务,例如bwin 网址 ,可以将启动一个新项目、研讨会或课程所需的成本和时间最小化。
  • 部署到VPC提供商:
    在主要的云平台上部署软件,如Amazon Web Services (AWS)或Azure,可以提供内部软件的充分灵活性和定制性。
  • 云市场产品:
    在AWS Marketplace和Azure等服务上提供的预构建应用程序使使用由供应商构建和测试的映像更加容易。云市场还可以提供简化的购买选项,从而可以访问IT基础设施预算,并使组织更容易跟踪总拥有成本。
  • 全面管理服务:
    这些产品,比如Amazon SageMaker或Azure ML上的RStudio,提供了云的便利性和可伸缩性,同时将维护和管理工作下放给云提供商或第三方。
  • 数据湖中的数据科学:
    通过将数据科学工具嵌入到现有的数据平台中,您的计算可以接近数据运行,最小化开销,并轻松绑定到数据管道中。

想了解更多吗?

RStudio支持您的数据科学云策略

无论您选择哪种方法,RStudio都提供了多种选项来支持您的云之旅。

通过SaaS解决方案简化和降低启动成本:

促进组织和团体之间的合作和指导:

  • 与他人分享项目或教授课程/研讨会RStudio云

降低计算基础设施的高成本:

扩大规模以满足变化的需求。除了上述选项(市场、全托管服务、vpc、Docker和云存储),RStudio的pro产品还提供了特定的功能:

减少数据移动。通过运行接近数据的计算,你可以最小化开销,并将你的数据科学直接绑定到你的数据管道:

  • 在您的云提供商上运行您的数据科学工具,无论是在市场、全托管服务或如上所列的vpc中,以帮助最小化数据移动
  • Spark的原生R接口:Sparklyr允许您轻松地过滤和聚合Spark数据集和流,然后将它们带入R进行分析和可视化,以大规模训练模型,并在Spark中生产机器学习管道。在spark了解更多信息
  • 连接到基于云的数据存储,如Snowflake, Redshift或S3,使用RStudio专业司机
  • 使用Amazon EFS弹性文件系统作为RStudio Team的共享文件系统

更多资源:

  • 读了博客“RStudio在您的云之旅中适合做什么?”
  • 的网络研讨会,“为什么云中的数据科学?”,与RStudio合作伙伴ProCogia合作
  • 了解更多关于bwin 网址 ,你可以在那里免费开始,或查看我们的可用的计划.如果您对使用RStudio Cloud进行教学感兴趣,请观看的网络研讨会,“RStudio云在线教学R”
与RStudio建立通话

来自同行的RStudio云故事

Baidu
map