Dev.Program/Python & R(15)
-
[Python] list.sort() 와 sorted(list) 의 차이
1. sort() 함수 list.sort([reverse=][, key=]) 리스트형의 메소드이며 리스트만 정렬 가능 원본 리스트를 직접 정렬하고 반환 값은 None (원본 리스트에 영향) reverse 기본값 False(오름차순) 1, 2, 3, ··· 예시 ) list = [3, 5, 1] print(list.sort()) # None print(list) # [1, 3, 5] 2. sorted() 함수 sorted(iterable[, key=][, reverse=]) 내장 함수이며 반복 가능한 모든 자료형 정렬 가능(리스트, 문자열, 튜플, 딕셔너리 등) 원본 리스트를 복사해서 새로운 리스트 반환 > 그래서 sort() 함수보다는 다소 느림 원본 리스트에는 영향 없음 예시 ) list = [3, 5..
2022.10.13 -
[R] 산점도 및 여러가지 그래프
======== test4.R 180p # 산점도 : 데이터 x, y 축에 점으로 표현한 그래프 # 나이와 소득 연속값으로 두 변수의 관계 표현 df # 막대그래프 df2% group_by(age,sex) %>% summarise(mean_income=mean(income)) age_sex_income ggplot(data=age_sex_income,aes(x=age,y=mean_income,col=sex))+geom_line()
2022.10.09 -
[R] if문 / 이상치데이터
======== test3.R 만들기 # p110 # 열이름 바꾸기 df_raw v2 열이름 수정 install.packages("dplyr") library(dplyr) df_new v_sum # df_new[열이름]=3, "B", "C")) df_new # 행, 열 조회 # filter 함수 class 가 1인 경우만 추출(행추출) # %>% 함수 나열 exam %>% filter(class==1) # filter class 3이 아닌 데이터 추출 exam %>% filter(class!=3) # filter class 1이면서 & math 50점 이상 데이터 추출 exam %>% filter(class==1&math>=50) # filter math 90점 이상이거나 | e..
2022.10.09 -
[R] 데이터 가져오기
# JSON :[{}] 텍스트 데이터 형식 # https://api.github.com/repositories 제이슨 형태의 데이터 # json 데이터 가져오기 url = "https://api.github.com/repositories" savename2 = "repo.json" # repo.json 형태로 파일을 저장하겠다 if not os.path.exists(savename2): req.urlretrieve(url, savename2) 파일 생성됨 import json items = json.load(open(savename2, "r", encoding="utf-8")) print(items) 리스트 안에 딕셔너리 형태로 읽어짐 딕셔너리 안에 있는 딕셔너리를 가져오..
2022.10.09 -
기상청 데이터
======== test5.py 파일 추가하기 import pandas as pd import matplotlib.pyplot as plt import numpy as np # 그래프 한글처리 import matplotlib matplotlib.rcParams['font.family']='Malgun Gothic' matplotlib.rcParams['axes.unicode_minus']=False move_p = pd.read_csv('move_P.csv', encoding='cp949') # plt.plot(move_p) index = np.arange(len(move_p)) plt.plot(index, move_p['서울특별시'], 'b-', label='서울') plt.plot(index, mov..
2022.10.09 -
여러가지 그래프
======== test3.py train.csv → 타이타닉 승객 명단 # test3.py # pandas 가져오기 # train.csv 파일 읽어들이기 import pandas as pd train_df = pd.read_csv('train.csv') print(train_df) print(train_df.head()) print(train_df.tail()) 상위 5개 하위 5개 print(train_df.mean()) 평균 print(train_df.describe()) print(train_df['Survived']) print(train_df['Survived'][500:600]) print(train_df[100:120]) print(train_df[['Survived', 'Pclass', ..
2022.10.09