Kernel: Python 3 (Anaconda)
Применение метода главных компонент для сжатия изображений
In [2]:
Загрузим известный набор данных MNIST — базу данных рукописных цифр.
Он входит как встроенный датасет в библиотеку sklearn.
In [3]:
In [5]:
Out[5]:
In [11]:
Out[11]:
array([[ 0., 0., 5., ..., 0., 0., 0.],
[ 0., 0., 0., ..., 10., 0., 0.],
[ 0., 0., 0., ..., 16., 9., 0.],
...,
[ 0., 0., 1., ..., 6., 0., 0.],
[ 0., 0., 2., ..., 12., 0., 0.],
[ 0., 0., 10., ..., 12., 1., 0.]])
Исходная матрица признаков для каждого объекта-картинки имеет 64 столбца.
Попробуем сократить их число до 2 и посмотрим, что из этого получится.
In [10]:
Out[10]:
array([[ -1.25946362, 21.27489134],
[ 7.95760554, -20.76870466],
[ 6.9919214 , -9.9559932 ],
...,
[ 10.80129219, -6.96023801],
[ -4.87210668, 12.42395215],
[ -0.34437734, 6.36556455]])
In [14]:
Out[14]:
In [12]:
Out[12]:
In [0]: