20200602

R软件

R是免费的
R是一个全面统计研究平台
提供各种各样的数据分析技术
R拥有顶尖的绘图功能

数据

数据:是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记记载的物理符号或这些物理符号的组合。

数据挖掘

数据挖掘:英文名叫Data Mining,又称为资料探勘、数据采矿。一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程(探索未知)和数据统计不同

数据与三个重大的思维转变

1、 要分析与某事物相关的所有数据,而不是依靠分析少量的数据样本**(需要分析大量数据)
2、我们乐于接受数据的纷繁复杂,而不再追求精确性
(允许有误差);
3、不再探求难以捉摸的因果关系,转而关注事物的
相关关系**。

数据可视化

将数据转化成视图
20200603

R语言起源

R是S语言的一种实现。S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析、作图的解释型语言。最初S语言的实现版本主要是S-PLUS。S-PLUS是一个商业软件,它基于S语言,并由MathSoft公司的统计科学部进一步完善。后来Auckland大学的 RobertGentleman和Ross Ihaka及其他志愿人员开发了一个R系统。R的使用与S- PLUS有很多类似之处,两个软件有一定的兼容性(起源来自S语言,大但用S语言的软件要钱,后来就有了R语言)

R语言的特点

1、有效的数据处理和保存机制。
2、拥有一整套数组和矩阵的操作运算符。
3、一系列连贯而又完整的数据分析中间工具。
4、图形统计可以对数据直接进行分析和显示,可用于多种图形设备。
5、一种相当完善、简洁和高效的程序设计语言。
6、R语言是彻底面向对象的统计编程语言。
7、R语言和其它编程语言、数据库之间有很好的接口。
8、R语言是自由软件,可以放心大胆地使用,但其功能却不比任何其它同类软件差。
9、R语言具有丰富的网上资源。

R的缺点

1、R软件不够规范,不容易上手,需要付出较多的努力,付出大量的学习成本;
2、R扩展包,太多了,需要利用较多的时间查找和学习。

RStudio

x <- 1 <-为赋值符号,相当于=号 给变量x赋值为1
y <<- 1 给变量y赋值为全局变量 值为1
x+y
在代码输入框输入这个 点击run 控制台会输出2
getwd() 获取当前工作空间
setwd() 设置工作空间
list.files()获取文件夹下内容文件
sum(1,2,3,4,5)函数 求和
在这里插入图片描述
ls()列出变量
ls.str()列出所有变量和它的值
当给变量设置值之后,可以输入变量名直接输出 底层是调用了print语句
rm()移除变量
rm(list=ls())用来删除所有变量
ctrl+l可以清屏
q()退出
save.image()保存

R包的安装(第三方扩展包)

https://cloud.r-project.org/
p11
20200604
用install.packages(“vcd”)来安装R包
用install.packages(c(“vcd”,“ca”))来批量安装R包
update.packages()来更新软件包
.libPaths()来查看R包所在位置

R包的使用

library()查看当前系统拥有的R包
里面如果带参就是载入参数R包 例如library(vcd) 那么就是载入vcd包 和require(vcd)同理
R软件包本身组成
在这里插入图片描述
R软件包其实就是一堆R包组成的
base包 是与R功能基础的函数
datasets包 用于存放数据集
grDevices包是基于base和grapics图形的图形设备 与绘图相关函数包都在这个包中
stats包存放与统计相关的函数
utils存放工具
methods包是一般定义的方法和类
使用help(package=“vcd”)来查看这个包的帮助文档

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐