목록Machine Learning/머신러닝기본 (2)
몰입공간
#1. Axis 데이터 분석을 하면서 다루게 되는 여러 데이터 유형과 Numpy를 통한 데이터 연산을 공부하다보면 axis라는 파라미터를 필수적으로 만나게 됩니다. 생각보다 이해가 힘들었던 axis 파라미터를 2차원 배열인 행렬(matrix)를 기준으로 넘파이의 argmax() 메서드와 sum() 메서드를 통해 알아보겠습니다. Axis는 말 그대로 '축'을 의미합니다. axis 파라미터에 따라 어떤 축을 기준으로 연산을 하겠구나라고 직관적으로 생각할 수 있지만, 막상 실습을 하면 생각보다 이해가 쉽지 않습니다. 사실 축을 기준으로 한다는 말이 조금 애매모호합니다. 차라리 축을 '따라' 연산을 한다 라고 생각하면 이해가 훨씬 쉬울 것 입니다. 그림에서 볼 수 있듯이 2차원 배열인 행렬(matrix)에서 a..
아래 내용은 머신러닝/딥러닝 실습을 위해 정리한 내용입니다. 틀린 내용이 있을 수 있습니다. #1. Pandas Pandas는 데이터의 처리/분석/출력에 매우 효과적인 툴로 Numpy와 함께 데이터 분석에 필수적으로 사용되는 라이브러리 입니다. 기본적인 자료형으로 1차원 배열 형태의 Series객체와 2차원 배열 형태의 DataFrame객체를 사용합니다. 데이터프레임의 배열 형태를 보면 흔히 사용하는 엑셀(Excel)과 유사한 형태를 지니고 있는 걸 알 수 있습니다. 본문의 내용은 구글 Colab으로 작성되었으며 Colab에는 기본적으로 Pandas 패키지가 설치되어 있습니다. import pandas as pd #2. Series (시리즈) Pandas의 Series객체는 인덱스와 값으로 구성됩니다. ..