受R及其社区的启发

RStudio团队为许多R包和项目贡献了代码。R用户正在科学、教育和工业领域从事一些最具创新性和最重要的工作。这是每天的灵感和挑战,以保持与社区和它所完成的一切。

管理包

如果跟上您使用的软件包数量的增长是一个挑战,请考虑一下RStudio包管理器


分析和探索

tidyverse是一个专门为数据科学设计的R包集合。所有包都共享一个基本原理和公共api。

项目网站链接

ggplot 2是r的增强数据可视化包,可以轻松创建令人惊叹的多层图形。

项目网站链接

Dplyr是plyr的下一个迭代,只关注数据帧。dplyr速度更快,具有更一致的API。

项目GitHub链接

Tidyr可以很容易地“整理”您的数据。整洁的数据是指易于处理的数据:易于munge(使用dplyr)、可视化(使用ggplot2或ggvis)和建模(使用R的数百个建模包)。

项目报告链接

purrr增强了R的函数式编程(FP)工具包,提供了一组完整而一致的工具,用于处理函数和向量。

项目网站链接

一组一致的、简单的、易于使用的包装器围绕着奇妙的'stringi'包。

项目网站链接

沟通与互动

Shiny在输入和输出之间具有自动的“反应式”绑定以及大量的预构建小部件。

项目网站链接

使用R Markdown在可复制的文档中开发您的代码和想法。将情节、表格和结果与叙述文本结合在一起,并创建分析准备分享。

项目网站链接

使用flexdashboard将相关数据可视化组作为仪表板发布。

项目网站链接

模型与预测

TensorFlow™是一个面向机器智能的开源软件库。TensorFlow的R接口可以让您高效地使用高级Keras和Estimator API以及核心TensorFlow API。

项目网站链接

tidymodels框架是一组使用tidyverse原理进行建模和机器学习的包。

项目网站链接

Sparklyr提供到Spark的分布式机器学习库的绑定。加上sparklyr的dplyr接口,您可以轻松地在Spark上创建和调优机器学习工作流,完全在R中编排。

项目网站链接

连接和集成

Sparklyr是Apache Spark的一个R接口,Apache Spark是一个快速通用的大数据处理引擎。这个包连接到本地和远程Apache Spark集群,一个“dplyr”兼容的后端,以及一个到Spark的ML算法的接口。

项目网站链接

管道工允许您将现有的R代码转换为web api,只需添加一些特殊的注释。

项目网站链接

网状包为Python和R之间的互操作性提供了一套全面的工具。

项目网站链接

额外的资源

Ursa Labs是一个行业资助的开发组织,专门从事开源数据科学工具。它致力于为数据科学家推动高生产力、高性能、跨语言软件的发展。

项目网站链接

数据库使用R

项目网站链接
Baidu
map