지극히 개인적인 공부 노트/인공지능(AI) 4

[인공지능] 머신러닝 '비지도 학습' 알고리즘 정리

현재 공부를 시작한 단계에 불과하며, 차근차근 공부한 머신러닝 알고리즘의 방식과 특징 등을 정리해나가는 게시글이다. 기술하는 내용은 모두 Python 기반이다. - 지도 학습 알고리즘과 다르게 데이터 중에서 타깃이 없을 때 사용하는 머신러닝 알고리즘이다. 1. k-평균(k-Means) 1) 무작위로 k개의 클러스터(군집) 중심을 선택하고, 점차 가장 가까운 샘플의 중심으로 이동하는 비교적 간단한 알고리즘 2) 평균값이 클러스터의 중심에 위치하기 때문에 '클러스터 중심' 또는 '센트로이드'라고 부르기도 한다. 3) 군집된 결과는 KMeans 클래스의 labels_ 속성, 클러스터 중심은 cluster_centers_ 속성, 알고리즘이 반..

[인공지능] 사이킷런(Scikit-learn) 패키지

k-최근접 이웃, 선형 회귀, 릿지, 라쏘, 다항 회귀, 로지스틱 회귀, 확률적 경사 하강법, 결정 트리 등의 알고리즘을 갖고 있는 대표적인 머신러닝 패키지입니다. 데이터를 이 패키지의 입력 데이터로 활용하기 위해선 2차원 리스트(배열 포함)로 입력 또는 변환해야 합니다. 또, 사이킷런을 통해 필요한 머신러닝 알고리즘을 임포트, 머신러닝 알고리즘의 모델 생성, 모델 평가 등의 순서로 이용합니다. 1. 모듈 1) model_selection: 모델의 데이터를 구성, 변환해주는 모듈 (1) train_test_split(): 훈련 세트와 테스트 세트로 함수 자체에서 랜덤하게 분리하며, 입력 데이터와 정답 데이터를 입력으로 받고, 이를 다음과 같이 각 변수에 자동으로 저장합니다. from sklearn.mod..

[인공지능] 머신러닝 '지도 학습' 알고리즘 정리

현재 공부를 시작한 단계에 불과하며, 차근차근 공부한 머신러닝 알고리즘의 방식과 특징 등을 정리해나가는 게시글이다. 기술하는 내용은 모두 Python 기반이다. - 지도 학습 알고리즘은 사용 용도와 목적에 따라 '분류'(샘플을 몇 개의 클래스 중 하나로 분류)와 '회귀'(임의의 어떤 숫자를 예측)로 나뉜다. - 대부분의 모델에는 훈련 과정에서 찾은 최적의 모델 파라미터(coef_와 intercept_)가 존재한다. 많은 머신러닝 알고리즘의 훈련 과정은 이 최적의 파라미터를 찾는 것이고, 이런 과정을 '모델 기반 학습'이라고 부른다. - k-최근접 이웃 알고리즘은 모델 파라미터가 따로 존재하지 않고, 단순히 훈련 세트를 저장하는 것이 훈련의 ..

[인공지능] 인공지능, 머신러닝, 딥러닝 간단 정리

1. 인공지능(Artificial Intelligence, AI) 1) 정의 인간의 학습능력과 추론능력, 지각능력, 자연언어의 이해능력 등을 컴퓨터 프로그램으로 실현한 기술 2) 변천사 연도 내용 비고 1943 워런 매컬러(Warren McCulloch)와 월터 피츠(Walter Pitts)가 최초로 뇌의 뉴련 개념을 발표(두뇌 논리회로 모델링) 여명기 1950 앨런 튜링(Alan Turing)이 인공지능과 인간이 같은 지능을 가졌는지 테스트할 수 있는 튜링 테스트 발표(현재의 로봇, 매크로 감지 테스트, reCAPTCHA) 1956 다트머스 컨퍼런스에서 AI 용어 탄생 태동기 1956~1970 수동적 대화 시스템 기호처리로 AI 구현 1차 인공지능 붐 1971~1979 컴퓨터 성능, 고려해야 할 범위 ..