기존의 MNIST Dataset 이 너무 많이 사용된 것과 함께 지루하다는 평이 있었다. 그러면서 등장한 것이 Fashion MNIST Dataset 입니다. 손글씨 숫자를 패션 아이템으로 대체한 것이 전부입니다.
모든 이미지는 28×28 로 기존의 MNIST 와 동일합니다. 10개의 분류는 다음과 같습니다.
Label | Description |
0 | T-shirt/top |
1 | Trouser |
2 | Pullover |
3 | Dress |
4 | Coat |
5 | Sandal |
6 | Shirt |
7 | Sneaker |
8 | Bag |
9 | Ankle boot |
기존의 손글씨 MNIST 와 패션 MNIST 에 담긴 내용을 화면에 출력해 보겠습니다.
패션 MNIST 를 불어오는 방법은 다음과 같습니다. 구글 CoLab 을 기준으로 설명합니다.
import keras
fashion_mnist = keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()
keras 에 있는 fashion_mnist 를 불러왔습니다. 이제 화면에 순서대로 160개의 이미지를 작게 출력해보겠습니다. 방법은 손글씨 MNIST 를 사용하는 것과 완벽하게 동일합니다.
import matplotlib.pyplot as plt
from tensorflow import keras
fashion_mnist = keras.datasets.fashion_mnist
(x_train, y_train), (x_test, y_test) = fashion_mnist.load_data()
fig, axes = plt.subplots(nrows=8, ncols=20)
ax = axes.ravel()
for i in range(160):
image = x_train[i]
ax[i].imshow(image, cmap='Greys')
ax[i].set_xticks([])
ax[i].set_yticks([])
plt.show()
이렇게 출력하면 위의 그림이 출력됩니다. CoLab 에서는 전송시 사용하는 데이터를 줄이기 위해 그림의 품질을 낮게 설정된 듯 합니다. 같은 코드를 PC 에서 실행하면 보다 깨끗한 품질의 결과물을 얻을 수 있습니다. 물론 그래봐야 이미지당 28×28 크기이니 기대는 하지 마세요.
참고링크