AI 의 "Hello World" MNIST 손글씨

2022. 1. 4. 19:09AI 개발/Chatbot개발

반응형

MNIST손글씨
미국국립표준원 MNIST에서 고등학생과 인구조사국에서 숫자손글씨 데이터를 모아 둔것으로 0~9 숫자로 구성되어 있습니다.

머신러닝의 "Hello World"정도로 기본이 되는 예제 
MNIST Dataset은 비교적 작기 때문에 머닝러닝 알고리즘을 설계하거나 검증할때 사용하기도 합니다.

 

MNIST 데이터 불러오기

우선 tensorflow 를 임포트 합니다.
Import tensorflow as tf
from tensorflow.keras.datasets import mnist

(x_train,y_train),(x_test,y_test) = mnist.load_data()

 


- 텐서플로에서는 MNIST 데이터셋을 기본적으로 제공
- load_data함수를 이용하여 학습데이터셋 6만개, 테스트데이터셋 만개를 다운로드 한 후 넘파이 배열 형태로 가져옴
- x_train에는 학습에 필요한 60,000장의 숫자이미지 (28*28) 데이터 저장
- y_train에는 숫자이미지의 라벨링된 실제 숫자값이 저장
- x_test와 y_test역시 동일한 형태이며 학습이 완료된 모델을 테스트하기 위해 필요한 데이터 셋

 

 

x_train.shape은 3차원이며 첫번쨰 60000은 데이터수, 2번째 3번쨰 인자는 샘플이미지의 사이즈를 의미 합니다.

y_train.shape는 1차원이며 숫자이미지의 라벨링된 실제 숫자값이 저장되어 있습니다.

반응형

'AI 개발 > Chatbot개발' 카테고리의 다른 글

Chatbot 개발환경  (0) 2022.01.03