일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- GraphX
- spark
- Python
- BigData
- Federated Learning
- r
- graph
- graph database
- 빅데이터
- 연합학습
- TensorFlow
- DeepLearning
- 그래프 질의언어
- Graph Ecosystem
- 인공지능
- GSQL
- 그래프 에코시스템
- Graph Tech
- RStudio
- GDB
- Cypher
- Neo4j
- SparkML
- 그래프
- RDD
- 분산 병렬 처리
- 딥러닝
- SQL
- 그래프 데이터베이스
- TigerGraph
- Today
- Total
Hee'World
데이터다루기 본문
데이터다루기
수치 변수파악
str() - 데이터 프레임의 구조나 벡터나 리스트를 포함한 R 데이터 구조를 표시하는 방법을 제공.
> str(iris)
'data.frame': 150 obs. of 5 variables:
$ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
$ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
$ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
$ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
$ Species : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
>
150obs는 150개의 관측이나 자료를 포함하고
5 variables는 5개의 속성이 있다는 것
변수 뒤에 num은 숫자 타입, (int는 정수타입, chr은 문자타입)
summary() - 일반적인 요약 통계를 보여준다.
> summary(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100 setosa :50
1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300 versicolor:50
Median :5.800 Median :3.000 Median :4.350 Median :1.300 virginica :50
Mean :5.843 Mean :3.057 Mean :3.758 Mean :1.199
3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800
Max. :7.900 Max. :4.400 Max. :6.900 Max. :2.500
>
'Programming > R' 카테고리의 다른 글
kNN 알고리즘 (0) | 2015.05.03 |
---|---|
머신 러닝의 기본단계 (0) | 2015.05.03 |
[R 머신러닝] 데이터에 맞는 알고리즘 (0) | 2015.05.02 |
가설과 검정 (0) | 2015.03.28 |
R의 기술통계 명령어 (0) | 2015.03.28 |