AI & BigData/데이터분석 관련 4

나이브 베이즈 분류(Naive Bayesian Classification) 란?

안녕하세요. 문범우입니다.이번 포스팅에서는 나이브 베이즈 분류(Naive Bayesian Classification)에 대해서 알아보도록 하겠습니다.나이브 베이즈 분류는 스팸 필터나 문서 분류등에서도 많이 사용되는 분류 방법으로써, 분류 문제에 있어서 현재도 많이 이용되는 방법입니다.1. 확률 이론 - 조건부 확률 나이브 베이즈 분류에 대해서 알아보기 전에 확률 이론중 조건부 확률에 대해 알아야 합니다.크게 어려운 내용은 아니니 간단하게 짚고 넘어가보도록 하겠습니다. 먼저 간단하게, 확률은 다음과 같이 나타냅니다.위의 그림과 같이, 파란색 구슬3개, 빨간색 구슬 2개로 총 5개의 구슬이 있을때,P(파란색 구슬) = 3/5P(빨간색 구슬) = 2/5입니다. 즉,P( A ) = A 의 경우의 수 / 전체 경..

Matplotlib 기초 정리

안녕하세요. 문범우입니다. 이번 포스팅에서는 파이썬 기반 시각화 라이브러리인 matplotlib에 대해서 알아보도록 하겠습니다. 해당 내용은 flearning의 김길호님의 강의를 바탕으로 작성되었습니다. https://www.flearning.net/courses/61. Matplotlib 이란? matplotlib은 다양한 데이터를 많은 방법으로 도식화 할 수 있도록 하는 파이썬 라이브러리로써, 우리는 matplotlib의 pyplot을 이용하게 됩니다. 이는 mathworks에서 개발한 매트랩(MATLAB)과 비슷한 형태를 가지고 있습니다. matplotlib을 이용하면 우리가 이전에 알아본 numpy나 pandas에서 사용되는 자료구조를 쉽게 시각화 할 수 있습니다. matplotlib을 사용하기 ..

pandas(판다스) 기초 정리

안녕하세요. 문범우입니다. 이번 포스팅에서는 파이썬 라이브러리인 pandas(판다스)에 대해서 알아보도록 하겠습니다. 해당 내용은 flearning의 김길호님의 강의를 바탕으로 작성되었습니다. https://www.flearning.net/courses/6 1. Pandas 란? Pandas는 파이썬에서 사용하는 데이터분석 라이브러리로, 행과 열로 이루어진 데이터 객체를 만들어 다룰 수 있게 되며 보다 안정적으로 대용량의 데이터들을 처리하는데 매우 편리한 도구 입니다. 먼저 pandas를 사용하기 위해서는 pandas를 설치한 이후에 아래와 같이 import를 해야 합니다. import pandas as pd 아래 실습에서는 jupyter notebook을 사용하였습니다. Pandas 기초¶ 1. Pan..

numpy(넘파이) 기초 정리

Numpy_clear 안녕하세요. 문범우입니다. 이번 포스팅에서는 python을 통해 데이터 분석을 할때 기초 라이브러리로 사용되는 Numpy에 대해서 알아보도록 하겠습니다. 해당 내용은 flearning의 김길호님의 강의를 바탕으로 작성되었습니다.https://www.flearning.net/courses/6 1. Numpy란 Numpy는 C언어로 구현된 파이썬 라이브러리로써, 고성능의 수치계산을 위해 제작되었습니다. Numerical Python의 줄임말이기도 한 Numpy는 벡터 및 행렬 연산에 있어서 매우 편리한 기능을 제공합니다. 또한 이는 데이터분석을 할 때 사용되는 라이브러리인 pandas와 matplotlib의 기반으로 사용되기도 합니다. numpy에서는 기본적으로 array라는 단위로 데..

728x90