본문 바로가기

분류 전체보기

(116)
벡터 벡터(vector)는 다른 프로그래밍 언어에서 흔히 접하는 배열의 개념으로, 한 가지 스칼라 데이터 타입의 데이터를 저장할 수 있다. 예를 들어, 숫자만 저장하는 배열, 문자열만 저장하는 배열이 벡터에 해당한다. R의 벡터는 슬라이스(slice)를 제공한다. 슬라이스란 배열의 일부를 잘라낸 뒤 이를 또 다시 배열처럼 다루는 개념을 뜻한다. 또한, 벡터의 각 셀에는 이름을 부여할 수 있다. 따라서 벡터에 저장된 요소들을 색인을 사용하여 접근하는 것뿐 아니라 이름을 사용해서도 접근할 수 있다. 이런 특징을 사용하면 데이터를 좀 더 의미 있는 형태로 저장할 수 있다. 벡터 생성 벡터는c()를 사용해 생성하고, names()를 사용해 이름을 부여할 수 있다. 아래에 벡터 관련 함수를 정리했따. -c : 주어진 ..
스칼라 이 절에서는 스칼라(scalar) 데이터 타입에 관해 살펴본다. 스칼라란 단일 차원의 값을 뜻하는 것으로 숫자 1,2,3,...을 예로 들 수 있다. 반면 좌표 평면 위에 있는 점인 (1,2)는 2차원 값이므로 이 절에서 설명하는 스칼라에 해당하지 않는다. R에서 데이터 타입의 기본은 벡터(vector)다. 따라서 스칼라 데이터는 길이가 1인 벡터(즉, 길이가 1인 배열)와 같은 것으로 볼 수 있다. 숫자 정수, 부동소수 등을 숫자형 데이터 타입으로 지원한다. 다음은 a에 3, b에 4.5를 저장한 뒤 c에 a와 b의 합을 저장하고, c의 값을 출력한 예다. 값을 출력하려면 print() 함수를 다른 언어처럼 호출해 쓰거나 마지막 행에 보인 예와 같이 print() 없이 변수명을 그대로 입력하면 된다. ..
변수 데이터 타입 설명에 앞서, 값을 저장하고 추출하는 방법을 알아보기 위해 R에서 사용하는 변수에 대해서 살펴보자. 변수 이름 규칙 R의 변수명은 알파벳, 숫자, _(언더스코어), .(마침표)로구성되며, -(하이픈)은 사용할 수 없다. 첫 글자는 알파벳 또는, . 으로 시작해야 한다. 만약 . 으로 시작한다면 . 뒤에 숫자가 올 수 없다. 예를 들어, 다음은 모두 올바른 변수명이다. a b a1 a2 .x 다음은 올바르지 않는 변수명이다. 2a .2 a-b 한 가지 흥미로운 사실은 R 1.9.0 이전에는 변수명에 _를 사용할 수 없었다는 점이다. 이런 역사적인 이유로 다른 언어에서 흔히 _를 사용할 만한 상황에서 R은 .을 사용한다. 예를 들어, training_data, validation_data 같은 ..
리눅스에 설치된 Rstudio에 package 설치하기! 앞서 다뤘던 리눅스에서 Rstudio를 설치 후 패키지를 설치하는 방법에 대해 알아보겠습니다. 인스턴스를 시작하고 앞에서 설치했던 Rstudio를 실행합니다. 탄력적ip:8787 실행이 됐다면, tidyverse 패키지를 설치하겠습니다. script를 열고, install.packagges("tidyverse")를 기입 후 ctrl+enter 를 입력합니다. 적지 않은 시간이 소요됩니다. 설치가 다 되었다면, 위의 코드를 한번 더 실행합니다. 위의 사진과 같이 나오는데, 해당 openssl-devel 이 설치가 되지 않았다는것을 확인할 수 있습니다. 구글에 centos openssl-devel 이라고 검색을 하면 제일 위의 링크를 들어갑니다. (사진에서는 libxml2-devel을 설치하는 것입니다.) ..
리눅스에서 Rstudio 설치하기 이번에 설명할 것은 기존에 생성했던 AWS의 리눅스에서 Rstudio를 설치하는 방법입니다. AWS에 접속하여 로그인 후 인스턴스를 시작합니다. 그 후 Putty(쁘띠)를 실행합니다. 이후, 자신의 ppk를 선택하여 오픈해줍니다. -리눅스환경에서의 초기세팅을 해줍니다. 방법은 위의 화면에서 sudo amazon-linux-extras install epel 을 기입합니다. -epel-release 설치-> sudo yum install -y epel-release 을 기입! -R설치하기는 sudo yum install -y R 을 기입! https://www.rstudio.com/products/rstudio/download-server/ 을 접속하여 자신이 사용하는 버전에 맞게 선택을 합니다. 저는 C..
함수-1 코딩하다 보면 특정 기능을 반복해서 수행해야 할 때가 있습니다. 그때마다 같은 기능을 수행하는 코드를 반복해서 작성한다면 비효율적일 것입니다. 이떄 사용할 수 있는 것이 함수(function)입니다. 함수는 특정 기능을 수행하는 코드의 묶음입니다. 함수를 이용하면 같은 기능을 수행하는 코드를 반복해서 작성할 필요가 없습니다. 또한 코드가 깔끔해지고 한번 만든 코드를 재사용할 수 있어서 코드를 작성하기가 편해집니다. 앞 장에서 파이썬 코드를 작성하면서 이미 몇몇 내장 함수를 이용했습니다. 출력을 위한 print()함수, 데이터 타입을 알기 위한 type()함수 등이 바로 내장 함수입니다. 이번 장에서는 코드의 묶음인 함수를 만들고, 함수를 이용하는 방법을 알아보고 주요 내장 함수의 사용법도 살펴보겠습니다...
입력과 출력-2 키보드 입력 키보드로 데이터를 입력하기 위해서는 input() 함수를 이용합니다. 이번에는 input() 함수를 이용해 데이터를 입력하고 그값을 받아서 처리하는 방법을 살펴보겠습니다. input() 함수로 데이터를 입력하기 위한 기본 구조는 다음과 같습니다. data = input("문자열") input() 함수 안의 '문자열'은 화면에 표시되고 키보드로 데이터를 입력한 후 Enter를 누르면 입력된 데이터는 문자열 형태로 data 변수에 대입됩니다. 다음 예는 input() 함수로부터 입력받은 데이터를 print() 함수로 출력하는 코드입니다. In : yourName=input("당신의 이름은? ") print("당신은 {}이군요.".format(yourName)) Out : 당신의 이름은 ? 홍길동..
입력과 출력-1 코딩할 때 실행한 결과를 화면이나 파일로 출력해야 할 때가 있습니다. 또한 입력을 키보드로 받거나 파일에 있는 데이터를 읽어서 처리해야 할 때도 있습니다. 이번 장에서는 파이썬으로 코드를 작성할 때 키보드와 화면으로 입출력하는 방법을 살펴보겠습니다. 화면 출력 작성한 코드의 결과를 확인하는 가장 기본적인 방법은 결과를 화면으로 출력하는 것입니다. 파이썬에서는 print()함수를 이용해 원하는 내용을 화면으로 출력할 수 있습니다. print() 함수에는 출력 형식을 지정하지 않는 기본출력 방법과 다양한 형식으로 출력할 수 있는 형식 지정 출력방법이 있습니다. 이 두 가지 방법에 대해 모두 알아보겠습니다. 기본 출력 먼저 print() 함수의 기본 출력 방법을 이용해 문자열과 숫자를 출력하는 방법을 알아보겠..