# json 데이터 가져오기 url = "https://api.github.com/repositories" savename2 = "repo.json" # repo.json 형태로 파일을 저장하겠다 if not os.path.exists(savename2): req.urlretrieve(url, savename2)
for item in items: print(item['name']+"-"+item['owner']['login'])
이런식으로 가져올 수 있다!
< 웹 API 데이터 가져오기 >
# 웹 API 데이터 가져오기 # 옥션, 지마켓, 아마존, ... 크롤링 => 웹 API(인증을 거쳐야 사용 가능) 서버 부하 감소 사용 # 날씨 정보, 상품데이터, 주가, 환율, ... => 웹 API 제공 # 웹 API : 사이트가 가지고 있는 정보를 외부에서도 쉽게 사용할 수 있게끔 공개 # 어떤 사이트에 웹 API 요청 => xml, json 형태로 제공
# API 키 apikey="474d59dd890c4108f62f192e0c6fce01" # 날짜 확인 도시(리스트) 지정 cities=["Seoul,KR","Tokyo,JP","New York,US"] #데이터 가져오는 주소 api="http://api.openweathermap.org/data/2.5/weather?q={city}&APPID={key}"
for cityname in cities: url = api.format(city=cityname, key=apikey) r = requests.get(url) data = json.loads(r.text) print(data)
# 파일 불러오기 # 엑셀 파일 불러오기 # readxl 패키지 설치 install.packages("readxl") # readxl 패키지 설치 library(readxl) # readxl 패키지 로드 df_exam=read_excel("excel_exam.xlsx") df_exam mean(df_exam$english) # 열이름 없는 데이터 # df_exam=read_excel("excel_exam.xlsx", col_names=F) # 엑셀 파일 sheet 선택 # df_exam=read_excel("excel_exam.xlsx", sheet=3)
# csv 파일 불러오기 df_csv_exam <- read.csv("csv_exam.csv") df_csv_exam # 문자가 있는 파일 불러올 때 # df_csv_exam<-read.csv("csv_exam.csv", stringsAsFactors=F)
# dataFrame -> csv 파일 저장 df_midterm2 write.csv(df_midterm2, file="df_midterm.csv")
파일 생성됨~!
# dataFrame -> rData 파일 저장(r전용파일) save(df_midterm2, file="df_midterm.rda")
load("df_midterm.rda")
# 데이터 파악 head(df_csv_exam) head(df_csv_exam, 3) tail(df_csv_exam) tail(df_csv_exam, 3)
View(df_csv_exam)
엑셀 모양으로 보여줌(대문자 View())
# 차원 행 열 dim(df_csv_exam) # 데이터 속성(형) 확인 str(df_csv_exam)