관리 메뉴

Hee'World

SparkR + RStudio설정 본문

BigData/Spark

SparkR + RStudio설정

Jonghee Jeon 2016. 12. 7. 23:04


<SparkR + RStudio 연동하기>



1. R과 RStudio는 미리 설치가 되어 있다는 전제하에 진행합니다.

2. Windows 환경에서 설정하였고, 리눅스 환경에서도 비슷할 것이라는 예상하에....진행 하였습니다.

3. 설정환경은 아래와 같습니다.

   R 3.3.1

   RStudio 0.98.501

   Spark 2.0.0


4. Spark 홈페이지에서 Spark를 다운로드 합니다.



5. 다운 받은 Spark를 적당한 곳에 압축 해제 후 RStudio를 실행합니다.

6. 실행한 RStudio에서 아래와 같은 명령어를 입력합니다.


Sys.setenv(SPARK_HOME = "Spark를 압축해제한 경로")

.libPaths(c(file.path(Sys.getenv("SPARK_HOME"), "R", "lib"), .libPaths()))


7. SPARK_HOME에 대한 환경변수를 설정 후 SparkR library를 로드합니다.


library(SparkR)





<끝>




 - 저도 웹에서 참고하여 작성하였으며, 출처는 저장하질 못해서 못 적었습니다..

'BigData > Spark' 카테고리의 다른 글

Spark RDD 문법  (0) 2020.04.06
Spark RDD  (0) 2020.04.04
Apache Spark란?  (0) 2020.04.04
Apache Spark 3.0  (0) 2020.03.06
Pandas API on Apache Spark  (0) 2020.02.23
Comments