Вчені Університету Техасу і Університету Корнелла кажуть, що технології машинного навчання легко відгадують за розмитими пікселями реальні дані, пише Wired.
Дослідники показали, що розмиття чутливих даних на фото не дозволяє побачити інформацію тільки людям – вони вгадують пікселізовану особа з ймовірністю 0,19%. У той же час програмний алгоритм для стандартного в індустрії набору даних має точність 71% для єдиної спроби і підвищує свої показники до 83%, якщо дати програмі вгадувати п’ять разів. При цьому алгоритм не прибирає розмиття на фото – він вгадує те, що за ним ховається.
Вчені також спробували використовувати свою технологію в реальному атаці – розпізнати людей, особи яких розмиті в роликах YouTube. Спочатку вони взяли базу фотографій людей і розмили на них особа інструментами YouTube. Це дозволило натренувати систему машинного навчання на основі глибокої нейронної мережі. Після цього алгоритм дізнавався людей з розмитими особами з точністю 57% при одноразовій обробці і з 85% точністю, якщо машина робила п’ять спроб.
«Це досить простий механізм, – говорить один з дослідників Річард Макферсон. – Єдине дійсне обмеження – це мати набір даних, на яких можна тренувати машинне навчання. Але це можна вирішити ».