Notice
Recent Posts
Recent Comments
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- 그래프
- Graph Ecosystem
- spark
- 분산 병렬 처리
- graph
- GraphX
- TensorFlow
- r
- Neo4j
- 인공지능
- 그래프 데이터베이스
- GDB
- 그래프 에코시스템
- 딥러닝
- BigData
- graph database
- Graph Tech
- Python
- Cypher
- SQL
- DeepLearning
- SparkML
- 연합학습
- RStudio
- 그래프 질의언어
- GSQL
- Federated Learning
- TigerGraph
- RDD
- 빅데이터
Archives
- Today
- Total
목록dataframe (1)
Hee'World
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/99ti3/btqDn0VzzdL/eS6VqCFrvpbEaZc9JGD5cK/img.png)
Spark에서 Row와 Column의 형태로 RDD를 표현하여 처리 할 수 있음 타입 - Python의 Pandas 패키지의 DataFrame과 R의 DataFrame과 동일한 개념 - Spark 2.x에서 Catalyst Optimizer의 도입으로 인해 Spark에서 지원하는 프로그래밍 타입 별 처리 성능이 동일하게 향상되었음 Spark DataFrame¶ spark.read.csv() spark.read.json() spark.read.format("csv") spark.read.format("json") file:// hdfs:// hbase:// s3:// In [1]: stock = spark.read.csv("data/appl_stock.csv", inferSchema=True, header..
BigData/Spark
2020. 4. 11. 16:10