패션 MNIST Dataset 사용법

기존의 MNIST Dataset 이 너무 많이 사용된 것과 함께 지루하다는 평이 있었다. 그러면서 등장한 것이 Fashion MNIST Dataset 입니다. 손글씨 숫자를 패션 아이템으로 대체한 것이 전부입니다.

모든 이미지는 28×28 로 기존의 MNIST 와 동일합니다. 10개의 분류는 다음과 같습니다.

LabelDescription
0T-shirt/top
1Trouser
2Pullover
3Dress
4Coat
5Sandal
6Shirt
7Sneaker
8Bag
9Ankle boot



기존의 손글씨 MNIST 와 패션 MNIST 에 담긴 내용을 화면에 출력해 보겠습니다.

패션 MNIST 를 불어오는 방법은 다음과 같습니다. 구글 CoLab 을 기준으로 설명합니다.


import keras

fashion_mnist = keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()


keras 에 있는 fashion_mnist 를 불러왔습니다. 이제 화면에 순서대로 160개의 이미지를 작게 출력해보겠습니다. 방법은 손글씨 MNIST 를 사용하는 것과 완벽하게 동일합니다.

import matplotlib.pyplot as plt
from tensorflow import keras

fashion_mnist = keras.datasets.fashion_mnist
(x_train, y_train), (x_test, y_test) = fashion_mnist.load_data()

fig, axes = plt.subplots(nrows=8, ncols=20)
ax = axes.ravel()

for i in range(160):
image = x_train[i]
ax[i].imshow(image, cmap='Greys')
ax[i].set_xticks([])
ax[i].set_yticks([])

plt.show()

이렇게 출력하면 위의 그림이 출력됩니다. CoLab 에서는 전송시 사용하는 데이터를 줄이기 위해 그림의 품질을 낮게 설정된 듯 합니다. 같은 코드를 PC 에서 실행하면 보다 깨끗한 품질의 결과물을 얻을 수 있습니다. 물론 그래봐야 이미지당 28×28 크기이니 기대는 하지 마세요.



참고링크

https://github.com/zalandoresearch/fashion-mnist

https://www.tensorflow.org/tutorials/keras/classification

Categories ML

Leave a Comment