Kernel: Python 3 (Anaconda)
Применение метода главных компонент для сжатия изображений
In [1]:
Загрузим известный набор данных MNIST — базу данных рукописных цифр.
Он входит как встроенный датасет в библиотеку sklearn.
In [2]:
In [3]:
Out[3]:
In [4]:
Out[4]:
array([[ 0., 0., 5., ..., 0., 0., 0.],
[ 0., 0., 0., ..., 10., 0., 0.],
[ 0., 0., 0., ..., 16., 9., 0.],
...,
[ 0., 0., 1., ..., 6., 0., 0.],
[ 0., 0., 2., ..., 12., 0., 0.],
[ 0., 0., 10., ..., 12., 1., 0.]])
Исходная матрица признаков для каждого объекта-картинки имеет 64 столбца.
Попробуем сократить их число до 2 и посмотрим, что из этого получится.
In [5]:
Out[5]:
array([[ -1.25946485, 21.27488513],
[ 7.95761341, -20.76869962],
[ 6.99192043, -9.95598935],
...,
[ 10.80128319, -6.96025224],
[ -4.87210004, 12.42394269],
[ -0.34439213, 6.36555063]])
In [6]:
Out[6]:
In [7]:
Out[7]:
In [0]: