Почему пора перестать слепо верить в big data

Сейчас алгоритмы решают, кому одобрить займ, кто получит страховку или приглашение на собеседование, но часто они делают это несправедливо. И это только увеличивает разрыв между слоями населения.

Кэти О'Нил (Cathy O'Neil)
Математик, специалист по анализу финансовых рынков, автор книги «Оружие математического поражения».

Чтобы построить алгоритм, нужны две вещи: данные (что произошло в прошлом) и определение успешного результата (что вы хотите найти с помощью этого алгоритма). Затем он определяет, какие критерии приводят к успешному результату. Но ведь определение успеха не может быть универсальным.

👌 В телеграм-канале «Лайфхакер» лучшие статьи о том, как сделать жизнь проще.

Алгоритм — это чьё-то мнение, встроенное в код.

Мы привыкли думать, что алгоритмы объективны и достоверны, но это только маркетинговый трюк, призванный запугать нас и вызвать у нас доверие к алгоритмам и математическим данным.

О’Нил приводит примеры, когда алгоритмы могут нанести серьёзный вред. Так происходит при оценке сотрудников. К примеру, в 2011 году в школьном округе Вашингтона было уволено более 200 учителей после того, как их отсеял алгоритм, хотя у них были отличные рекомендации от родителей и коллег.

Кроме того, алгоритмы часто оказываются причиной вынесения предвзятых приговоров. Новостная организация ProPublica недавно проводила расследование и обнаружила, что алгоритмы, определяющие риск рецидивизма, работают не объективно. При одинаковых преступлениях приговоры чаще выносятся чернокожим американцам.

Все мы подвержены предубеждениям, и мы привносим их в алгоритмы, когда решаем, какие данные нужно учитывать.

Алгоритмы просто повторяют наши прошлые ошибки, автоматизируют существующий порядок. Поэтому мы не можем слепо доверять им, мы должны проверять их на объективность: заново обдумать определение успешного результата, ошибки, от которых не застрахован ни один алгоритм. Как часто они происходят и кого затрагивают? Какова цена таких ошибок?

Специалисты, работающие с данными, не должны быть вершителями справедливости. Пора перестать слепо верить большим данным.

Это упрощённая версия страницы.

Читать полную версию
Олег Залялов
24.09.17 23:42
Слепо верить вообще ни во что не надо было начинать. А статья какая-то невнятная.
Антон Афанасьев
25.09.17 07:24
Позвольте, господа и дамы. Во-первых, речь скорее о Machine learning или Data mining, а не о big data. Это видимо, подразумевается, так как проводить машинное обучение эффективнее на больших данных. Во-вторых, фраза "Все мы подвержены предубеждениям, и мы привносим их в алгоритмы, когда решаем, какие данные нужно учитывать" довольно странная, потому что при обучении берут много-много критериев и в процессе построения модели часть может отсеяться, но не по субъективным причинам, а по объективным цифрам, которые характеризуют значимость критерия. Другое дело, что исходные данные могут быть не эффективными. Не всё можно загнать в цифры. Ту же эмпатию и внимательность к ученикам. В общем, название статьи хорошее, а содержание мутное.
Roman Pravuk
25.09.17 09:39
Не факт что речь идет о ML. Скорее всего о BigData, поскольку обсуждаётся одни из типовых задач BigData