Loading data
from Text
https://www.youtube.com/watch?v=aMYCFtoBrdA by Gopal Malakar
fread
dat파일 못읽음.
일반적인(각 행이 같은 열갯수를 가진 delimited files에 적용하고, 아닌면 read.table사용
read.table() with textConnection()
read.table("A.txt", header=F, sep = "|", fill=T, quote="", stringsAsFactors=F)
read.table함수는 file을 소스로 읽어들이기 때문에, textConnection이라는 트릭이 필요하다.
없으면, Error in file(file, "rt") : cannot open the connection
이라는 에러발생
(따라서, Data를 저장된 txt파일로 만들어 사용할때도 있다.
Default로 구분자는 공백문자, 소수점으로 도트 문자 사용)
https://onunicornsandgenes.blog/2014/03/06/using-r-common-errors-in-table-import/
from Excel :: library(readxl)
https://cran.r-project.org/web/packages/readxl/index.html
http://blog.naver.com/hancury?Redirect=Log&logNo=220332744275
Hadley Wickham이 Rcpp로 개발한 readxl 패키지
read_xlsx 또는 read_excel
excel_sheets
엑셀파일안에 모든 sheets를 보여준다.
from URL
Url에서 직접 로드
Url에서 다운받아서 로드
temp download.file unzip
read.fwf()
fixed width file, 구분자가 아닌 고정된 폭 구조의 데이터
외부 CSV파일 한글깨짐 – mac
csv 데이터를 가져오는 방법은 fread와 read.csv(read.table) 정도가 있는데,
macbook을 사용하다보면 한글이 깨지는 경우가 많다. 이때 macos의 excel로 해당파일을 열어봐도 깨져있는경우는 os 자체가 제대로 지원하지 않는다고 볼수 있어, 원본 파일을 수정하는 방법밖에는 없다.
excel> DATA> from text (외부데이터가져오기)>
delimited 선택, file_origin:Korean(MacOS) > Comma> 완료.