일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- graph database
- r
- Federated Learning
- TensorFlow
- SparkML
- GSQL
- 그래프 데이터베이스
- Graph Ecosystem
- GraphX
- 딥러닝
- 그래프
- TigerGraph
- Neo4j
- 분산 병렬 처리
- 그래프 에코시스템
- graph
- 연합학습
- spark
- 그래프 질의언어
- Graph Tech
- 인공지능
- Cypher
- 빅데이터
- RDD
- GDB
- BigData
- DeepLearning
- RStudio
- Python
- SQL
- Today
- Total
Hee'World
R을 위한 기초 통계 본문
- 확률 이론은 통계학의 바탕이며, 경험 혹은 실험의 결과로 특정한 사전(Event)이나 결과가 발생할 가능성
2. 확률 분포
- 확률분포는 확률번수가 특정한 값을 가질 확률, 즉 상대적 가능성을 나타낸 것으로 모든 가능한 확률변수값과 그 값이 발생할 가능성인 확률 값을 도수분포표나 그래프로 나타낸 것이다.
3. 확률 변수
- 특정한 값을 가질 수 있는 확률이 주어진 변수
- 이산확률변수 : 정수와 같이 명확한 값을 변수 값으로 함.
확률변수가 가질 수 있는 값의 수가 한정되어 그 수를 셀 수 있는 변수
- 연속확률변수 : 변수 값이 정수처럼 명확하지 못함.
확률변수가 연속량으로 표기되어 가능한 변수 값의 개수를 셀 수 없는 변수
- 인터넷자료 -
R에는 확률, 확률분포, 확률변수를 다루는 함수가 다양하다.
R에서의 분포 이름
함 수 |
용 도 |
dnorm |
정규분포 확률 밀도(Normal density) |
pnorm |
정규분포 함수(Normal distribution function) |
qnorm |
정규분포 분위수 함수(Normal quantile function) |
rnorm |
정규분포 난수(Normal random variates) |
이산분포
이산분포 이름 |
R에서의 이름 |
모수(인자) |
이항(Binomial) |
binom |
n = 시행 횟수, p = 시행 한 번당 성공 확률 |
기하(Geometric) |
geom |
p = 시행 한 번당 성공 확률 |
초기하(Hypergeometric) |
hyper |
m = 항아리에 든 흰색 공의 개수, n = 항아리에 든 검은 색 공의 개수, k = 항아리에서 꺼낸 공의 개수 |
음이항(Negative binomial, NegBinomial) |
rbinom |
size = 성공한 시행 횟수, prob = 성공한 시행의 확률 또는 mu = 평균, 둘 중 하나 선택 |
푸이송(Poisson) |
pois |
lambda = 평균 |
연속분포
연속분포 이름 |
R에서의 이름 |
모수(인자) |
베타(Beta) |
beta |
shape1, shape2 |
코쉬(Cauchy) |
cauchy |
location, scale |
카이제곱(Chi-squared(Chisquare)) |
chisq |
df = 자유도 |
지수(Exponential) |
exp |
rate |
F |
f |
df1와 df2 = 자유도 |
감마(Gamma) |
gamma |
rate, rate 또는 scale 둘 중 하나 선택 |
로그 정규(Log-normal(Lognormal) |
lnorm |
meanlog = 로그 척도로 된 평균, sdlog = 로그 척도로 된 표준편차 |
로지스틱(Logistic) |
logis |
location, scale |
정규(normal) |
norm |
mean, sd = 표준편차 |
Student's t (TDist) |
t |
df = 자유도 |
균등(Uniform) |
unif |
min = 하한, max = 상한 |
와이블(Weibull) |
weibull |
shape, scale |
윌콕슨(Wilcoxon) |
wilcox |
m = 첫 표본에 있는 관측값들의 개수, n = 둘째 표본에 있는 관측값들의 개 |
- R Cookbook -
'Programming > R' 카테고리의 다른 글
R의 기본 자료형 (0) | 2014.03.29 |
---|---|
[R_Error] Error in loadNamespace(i, c(lib.loc, .libPaths())) : (0) | 2013.11.01 |
기초 통계 용어 (Outlier) (0) | 2013.10.31 |
R studio 설치 (0) | 2013.10.10 |
[1004jonghee]CentOS R 설치 (0) | 2013.07.31 |