본문 바로가기

팬더스3

머신 러닝 다중 선형 회귀(Multiple Linear Regression) #1 -다중 선형 회귀를 이용한 집값 예측하기 여러 입력 변수를 이용하여 선형 회귀를 하면 그것이 바로 다중 선형 회귀!! - 다중 선회 회귀는 시각적으로 표현하기가 힘들다. tip. 입력 변수 = 속성(feature) - 각 속성 항목들의 표현 방식 정리 - 다중 선형 회귀에서의 가설 함수 - 다중 선형 회귀 데이터 준비하기 from sklearn.datasets import load_boston import pandas as pd boston_dataset = load_boston() print(boston_dataset.DESCR) :Attribute Information (in order): - CRIM per capita crime rate by town - ZN proportion of residential land zoned for lo.. 2021. 2. 5.
팬더스 데이터프레임 여러 방법을 이용한 생성 및 순회 처리하기 1. 데이터프레임이란? ~ 시리즈의 경우 단일 변수 기록은 용이하지만, 여러 변수에 대한 값을 기록하기에는 접학 하지 않다. ex) 내 뱃살 증가치만 기록하면 시리즈도 괜찮지만 내 키, 뱃살, 콜레스테롤 수치, 혈당 등등 여러가지를 기록하기에는 어렵다는 그래서 데이터 프레임 사용 데이터프레임은 인덱스 하나와 여러 시리즈를 합친 자료형 팬더스 라이브러리 사용시 엑셀, HTML, DB로부터 데이터를 읽어와 데이터프레임 형태로 가공할 수 있다. 반대로 데이터프레임으로 HTML, DB 등으로 저장 가능 2. 딕셔너리를 이용한 데이터프레임 생성 (딕셔너리는 Key와 Value를 한 쌍으로 갖는 자료형) 2014년부터 2018년까지 KOSPI 지수와 KOSDAQ 지수를 이용하여 데이터프레임을 만들면 - 생성한 데이.. 2020. 12. 22.
파이썬 라이브러리인 pandas(판다스) 설치, 시리즈 (생성,변경,수정,인덱싱,삭제,시각화) 파이썬 라이브러리인 pandas(판다스) - 팬더스라고도 부름 - 금융 데이터 분석을 목적으로 개발 되었다. - 구조화된 데이터를 쉽고 파르게 가공할 수 있는 자료형과 함수를 제공한다. - > 행과 열로 이루어진 데이터 객체를 데이터로 생성 - > 안정적으로 대용량의 데이터들을 매우 편리하게 처리할 수 있다. 시간의 흐롬에 따라 기록한 데이터를 시계열 시리즈는 이런한 시계열 데이터를 다루는 데 적합하다. tip. 데이터 프레임은 여러 시리즈가 한 가지 인덱스를 기준으로 합쳐진 형태 1. 설치 C:\Users\user\AppData\Local\Programs\Python>pip install pandas 2. 시리즈 생성하기 시리즈로 생성할 데이터를 리스트 형태로 Series() 생성자에 넘겨주는 것만으로.. 2020. 12. 19.
728x90
반응형