Tagged: big data

The Art of Invisibility by Mitnick. 5/5

img_1457Кевин Митник написал “Искусство быть невидимым” про тему цифровой безопасности или кибербезопасности в домашних условиях. Ключевая идея книги – как дыры в используемом нами на доверии программном обеспечении могут быть использованы против вас. Компрометация деловых переговоров, потеря доступа к банковским счетам, утечка кредитной информации.

Книга читается на одном дыхании. Вот идеи из книги. Continue reading

Н: Предугадать смерть с 90% вероятностью

Что будет, если биг дата по здоровью соединить с машинным обучением? Получится алгоритм, который с вероятностью 90% предугадывает наступление сердечного приступа и последующей смерти.

Поскольку ключевое слово “предугадывает”, то есть время не допустить печального летального исхода. Финны изобрели технику, как это делается. Рассказываем. Continue reading

Р: What Big Data Can’t Do by Tenner.

0B6CD1B4-6E71-4097-AFF2-A11028760A9DОчень трезвая профессиональная книга Эдварда Теннера про то, где применяли биг дату, и почему она зачастую не давала ожидаемого эффекта. Это к тому, что любая модная и актуальная идея может не выдерживать теста реальности так, как мы от нее ожидаем. Continue reading

T: Двадцать дискет и big data

Мой первый опыт работы с большими массивами данных начался с дискет. Тех, что три дюйма и по 1.44 мегабайта на каждой. Судьбой я оказался на градообразующем предприятии. Мой босс сказал мне, что есть гипотеза, что качество материалов на входе влияет на качество продукции на выходе. И отправил меня за данными для ее проверки.

Гипотеза очевидная, конечно же, жизнь так и устроена. Garbage in – garbage out. Хорошие материалы – хороший продукт. Осталось добыть данные в эпоху, когда аббревиатуры SAP/ OeBS/ ERP в принципе были особенно не известны, не говоря уж о практическом их применении. Поэтому подход, что сейчас сделаем запрос или найдем специалиста – не работал. Continue reading

Н: Все видно. Все слышно.

Мегатренд прозрачности неотвратим. Знать, где вы были, что вы делали, что писали – это то, куда общество двигалось и будет двигаться. Мы снова смотрим на замечательную статью Медузы про “Острый глаз” – и понимаем, что будущее быстро наступает.

Что сделали китайцы – они ставят сотни миллионов видеокамер по стране и учатся собирать и распознавать с них видеоконтент. Это дает возможность отслеживать, кто где когда был и кто куда как передвигался. Получается, что вкупе с анализом голосового трафика, наличия смартфона в кармане можно… Continue reading

Р: Data and Goliath. 5/5 и 19%.

img_0004-1Давно мы не брали в руки такой книги, чтоб за одну субботу читалась бы от начала и до конца. Автор – спец по кибербезопасности и криптографии, советник в Конгрессе США. То есть топовый автор на тему, как за нами следят и что про нас знают.

Кстати, именно эта книга объясняет, почему надо читать бумажные. Потому что про электронные, например Kindle, вся ваша информация о ходе чтения, скорости, предпочтениях и даже геометках, где вы находитесь – не является приватной. За вами следят прямо затем, как вы читаете. Continue reading

Т: Математика в бизнесе

Честно – математика является мощнейшим инструментом для улучшения бизнеса. Мы решили вспомнить набор прагматичных применений математики в бизнесе из собственного опыта. Только того, что сами видели и делали как работающие решения.

Давайте посмотрим, что можно сделать проверенными способами до внедрения big data, AI и ML? То есть теорией игр, с добавлением регрессий, с линейным программированием, факторным анализом, поиском экстремумов функции и сценарными подходами в моделировании.

Раз пример. Теория игр для маркетинга. Continue reading

Н: Ружье, черепаха и десятый айфон.

Совершенно забавная новость, продолжающая рецензию про «оружие матемассического поражения», когда алгоритмы сильно ошибаются, прилетела в виде краткого видео. Черепаха или ружьё? Вам решать.

Суть проста. Машинное обучение подразумевает эволюционную дрессировку алгоритмов. Удалось – оставили решение, нет – поменяли подход. В части изображений это касается сравнения паттернов точек.

Поэтому получается, что для нас кошка, то для компьютера … гуакамоле. Continue reading

Р: Weapons of Math Destruction. 5/5 и 23%.

img_3650Дождались. После книг про Big Data и Small Data мы нашли на полке в Barnes&Noble книгу профессора математики про неожиданные негативные последствия массового применения алгоритмов машинного обучения в жизни.

Кати О’Нил преподавала высшую математику в Barnard at Columbia. Затем ее пригласили работать в самый крутой квантовый хедж-фонд. Как обычно, человек встал на одну сторону, а затем перешел на другую после разочарования.

Поэтому книгу на русском надо называть «Оружие матемассического поражения». Читается без остановки запоем за выходные. Как математикой нечаянно нанести массовый ущерб? Разбираем: Continue reading

Н: 100 новых профессий для самого редкого поколения.

Коммерсант дал простую и наглядную статью “Мамы из ямы”. В ней есть объяснение стремительного снижения рождаемости. Но, что еще прозрачнее – демографическая елочка, которая в один график объясняет, почему россиян становится сильно меньше. Средний возраст первых рождений сейчас 27 лет. То есть мамами становятся те, кто родились в среднем вокруг 1990 года, когда случился русский крест, или резкий спад рождений с ростом смертности.

1990 + 27 = 2017.

На фоне того, что каждое следующее поколение теперь на 20% менее многочисленное, то в этом надо искать плюс для тех, кого мало. Один из них уже сейчас очевиден – компании начали биться за молодые кадры. Если в начале 2010-х эта политика была только в отдельных продвинутых компаниях, то теперь она становится необходимой для всех. Другой плюс нашелся в замечательном атласе 100 новых профессий, которые сейчас возникнут. Что там? Continue reading

Toolkit: Развести продажи, опермаркетинг и стратмаркетинг.

Берем корпорацию. Корпорация живет, пока умеет продавать. Продажи – это корень бизнеса. ‘Find the need and meet it!” – как говорит мой ментор Том. За неделю поступило сразу два вопроса на тематику “Что есть стратмаркетинг и где про это прочитать?”.

Маркетинг рождается, когда продажи начинают требовать профессиональной поддержки. Этот момент простой – как только бизнес вырастает до уровня специализации, что руководитель продаж уже не отвечает за полную прибыль своей линейки, так как не контролирует ее стоимость. Другими словами, собственник делегирует задачу продаж наемному менеджеру. В этот момент продажи становятся заточенными на простые объемов/цен/доли рынка/маржи. И появляется первый конструктивный конфликт. Маркетинга как анализа рынка и постановщика целей для продажи, и вертикали продаж, как генератора выручки компании. Задача продаж – приносить деньги. Задача маркетинга – защищать интересы акционера. Что делает организация? – создает управление маркетинга в подчинении директора по продажам, выбирая из двух зол.

Первое зло. Continue reading

Новость: Пропажа среднего менеджмента.

Три десятилетия назад Питер Друкер предсказал предстоящую пропажу среднего звена управленцев. То есть уплощение организационной структуры, исчезновение стандартных управленческих вертикалей и одновременной централизацией/делегированием полномочий и ответственности.

Профессор оказался прав, и теперь мегатренд уплощения организаций очевиден. Старые бизнеса еще держатся на матричной административно-функциональной структуре, эволюционно сокращая слои управления. Молодые уже работают изначально в новой модели.

Давайте разберем примеры, как происходит уничтожение уровней управления. Что это значит для сегодняшних и будущих работников.

Как уничтожить уровень управления в корпорации? Continue reading

Рецензия: Homo Deus. Yuval Noah Harari. 3/5 и 16%.

img_2860Книга-бестселлер про будущее “Человека Божественного” моделирует, как изменится человечество в ближайшее поколение. Книга начинается с хорошей базы предыдущего труда “Sapiens“, который объясняет всю предыдущую историю человечества.

Соответственно, вся предыдущая история описывается формулой – рождаемость против смертей от голода, болезней и войн. Сейчас тот период истории, когда человечество укротило каждую из данных причин. Если где и есть голод, то по политическим причинам, так как еды на планете хватает. Инфекционные болезни укрощены вакцинами и гигиеной, остались в основном болезни износа организма как механизма. Войны сейчас уносят куда меньший процент населения, чем прежде.

Поэтому, человек сейчас, как никогда, близок к бессмертию.

Книга начинается с 15 закладок на первые сто страниц, или 15% содержательности, всего в книге 16% содержательности. Оценка за интересность 3.

Но бессмертие у Харари это не то, что мы представляем, и не для всех. Continue reading

Новость: Poker Go Chess Checkers

По итогам двадцати дней игр, алгоритм разгромно побил лучших игроков в покер, взяв 1.7 миллиона выигрыша, оставив каждого из игроков в долгах. Что это значит?

Посмотрим стратегически на данную ситуацию. Вернемся в прошлое, анализируя четыре известные игры. Шашки, шахматы, го и покер. И сделаем выводы для человечества.

Шашки – это полностью решенная игра. То есть компьютер, играя черными, никогда никому не проиграет. Вы, играя белыми, никогда у компьютера не выиграете. Потому что игра решена исчерпывающим перебором всех вариантов. Это тупое решение, так как перебраны все возможности. Здесь никакого AI не надо. Ничего удивительного нет. Просто решение в лоб.

Шахматы – это нерешенная игра. Continue reading

Книга: The Undoing Project. Michael Lewis.

img_2652Майкл Льюис для многих начался с “Покера Лжецов”, который можно перечитывать каждый год как заново. В этом году вышла новая книга про тему как мы воспринимаем реальность и людей вокруг нас, и как трактуем их и их отношения. Из аналогичных интересных трудов можно посмотреть ‘Outliers’ by Gladwell 5/5; Ellenberg ‘How Not to Be Wrong’ 4/5 и Lindstrom ‘Small Data’ 5/5.

Если взглянуть назад на 52 прочитанные книги года – по одной на каждую неделю – то точно стоит повторить данную практику и далее. На полках есть около 40 непрочитанных книг, как раз до сентября. Точно стоит справиться с тремя книгами Gabriel García Márquez вне бизнес-тематик: El coronel no tiene quien le escriba; El otoño del patriarca и Cien años de soledad.

На ближайшую неделю перелетов и командировок нет, будем добирать страницы по утрам.

Итого, за этот год 52 книги (рецензии ниже по ссылкам):

Continue reading

Новость: Как Амазон уничтожит и заработает.

Продолжаем серию публикаций про Грузоперевозки Убер, про “роботизацию” медицины, про искусственный разум на совете директоров и книгу “Неизбежное”. На этой неделе еще одна новость, подтверждающая тренд дальнейшего уничтожения за счет machine learning базовых профессий – это Amazon Go. Разберем красивую картинку и видео на компоненты бизнес-модели и прибыли.

Задача Амазона – создать быстрый магазин без очередей, без необходимости тройной перекладки продукта (полка-корзина-лента-сумка), с полной историей покупок каждого клиента. И заработать на этом с минимальными инвестициями. Как?

Такой магазин уничтожает несколько расходных статей, попутно убивая часть смежных бизнесов.

Первое. Он уничтожает наличность и карточки. В краткосрочной перспективе исчезает инкассация. В долгосрочной перспективе становятся ненужными Visa и Mastercard, так как счет Амазон можно привязать напрямую к банковскому счету без карточки. Для потребителя это потенциал 1-3% снижения цены.

Continue reading

Рецензия: Small Data. 5/5 и 14%.

img_2464Безоговорочно сильная книга. Martin Lindstrom ‘Small Data’. Однозначно бьет книгу Big Data с прошлой недели. Термин “большие данные”, который появился из интернет-торговли, собирающей огромные массивы информации по своим покупателям, а потом перешедший как модный в другие отрасли, имеет большие недостатки. Можно было бы критиковать подход, но Мартин выбрал вместо этого другой путь – не трогая Big Data, он приводит свой метод работы как маркетолога, который часто выигрывает (но и отлично дополняет Big Data). Small Data – это та информация, которая не существует в оцифрованном виде, и, по-видимости, не будет существовать, потому что она не фотографируется, не кликается, не датабазится. Однозначно книга на 5 из 5 (одна из лучших книг года). По содержательности – 16 закладок на первые сто страниц, во всей книге 14% содержательности, то есть автор качество контента к концу книги не снижает.

Как найти Small Data и заработать на ней деньги?

Continue reading

Новость недели: Конец докторов и аналитиков?

Когда мы затрагивали тематики, какие профессии из нынешних будут уходить в прошлое, будучи замененными IT решениями, то наибольший скептицизм вызывали предсказания, что из-за своей алгоритмизируемости и наличия big data специальности медицинских докторов и аналитических профессий в бизнесе (включая совет директоров) – будут заменяться компьютерами. Понятно, что время рассудит, но три новости с этой недели точно означают, что будущее уже рядом. Нет, неправильно: будущее уже наступило.

Про исчезающих докторов, уходящих аналитиков, снова 18-wheelers. И куда инвестировать.

Continue reading

Книга недели: Small Data

img_2457Не без приключений. В аэропорту служба безопасности тормознула мой чемодан с книгами, как подозрительный. Маленький и тяжелый (24 килограмма).

Вскрыли, досмотрели и положили записку на память, что ничего не нашли, и заперли обратно. Рецензия будет на следующей неделе. Книга отлично контрастирует с Big Data, объясняя на кончиках пальцев примерами, где Big Data бескомпромиссно проигрывает Small Data (неоцифровываемым наблюдениям).

Рецензия: Big Data 3/5 и 9%

Термин Big Data не имеет сложившегося определения. Но последние три года он активно используется где угодно и где неугодно. Одноименная книга использует два определения. Одно логически неправильное, другое логически правильное. Первое: “Большие данные – это то, что можно сделать по-большому, и нельзя сделать по-маленькому”. Второе: “Когда выборка данных для анализа равна генеральной совокупности”.  img_2456

Первые 100 страниц имеют 8 закладок, или 8% содержательности. Всего на 205 страниц 19 закладок, или 9% содержательности. Оценка 3/5.

Чтобы попытаться уйти от критики, автор сразу делает оговорку, что причинно-следственные связи Big Data не интересуют, а только корреляции.

Почему автор игнорирует тематику причинно-следственных связей между входами больших данных и выходами из их анализа? Две причины: когда вводных и выводных параметров тысячи-миллионы, то попробовать объяснить найденную корреляцию весьма затруднительно; также вполне вероятны случайные корреляции, которые объяснять нет смысла. Поэтому проще игнорировать.

Continue reading