Tagged: big data

Н: Предугадать смерть с 90% вероятностью

Что будет, если биг дата по здоровью соединить с машинным обучением? Получится алгоритм, который с вероятностью 90% предугадывает наступление сердечного приступа и последующей смерти.

Поскольку ключевое слово «предугадывает», то есть время не допустить печального летального исхода. Финны изобрели технику, как это делается. Рассказываем. Читать далее

Р: What Big Data Can’t Do by Tenner.

0B6CD1B4-6E71-4097-AFF2-A11028760A9DОчень трезвая профессиональная книга Эдварда Теннера про то, где применяли биг дату, и почему она зачастую не давала ожидаемого эффекта. Это к тому, что любая модная и актуальная идея может не выдерживать теста реальности так, как мы от нее ожидаем. Читать далее

T: Двадцать дискет и big data

Мой первый опыт работы с большими массивами данных начался с дискет. Тех, что три дюйма и по 1.44 мегабайта на каждой. Судьбой я оказался на градообразующем предприятии. Мой босс сказал мне, что есть гипотеза, что качество материалов на входе влияет на качество продукции на выходе. И отправил меня за данными для ее проверки.

Гипотеза очевидная, конечно же, жизнь так и устроена. Garbage in — garbage out. Хорошие материалы — хороший продукт. Осталось добыть данные в эпоху, когда аббревиатуры SAP/ OeBS/ ERP в принципе были особенно не известны, не говоря уж о практическом их применении. Поэтому подход, что сейчас сделаем запрос или найдем специалиста — не работал. Читать далее

Н: Все видно. Все слышно.

Мегатренд прозрачности неотвратим. Знать, где вы были, что вы делали, что писали — это то, куда общество двигалось и будет двигаться. Мы снова смотрим на замечательную статью Медузы про «Острый глаз» — и понимаем, что будущее быстро наступает.

Что сделали китайцы — они ставят сотни миллионов видеокамер по стране и учатся собирать и распознавать с них видеоконтент. Это дает возможность отслеживать, кто где когда был и кто куда как передвигался. Получается, что вкупе с анализом голосового трафика, наличия смартфона в кармане можно… Читать далее

Р: Data and Goliath. 5/5 и 19%.

img_0004-1Давно мы не брали в руки такой книги, чтоб за одну субботу читалась бы от начала и до конца. Автор — спец по кибербезопасности и криптографии, советник в Конгрессе США. То есть топовый автор на тему, как за нами следят и что про нас знают.

Кстати, именно эта книга объясняет, почему надо читать бумажные. Потому что про электронные, например Kindle, вся ваша информация о ходе чтения, скорости, предпочтениях и даже геометках, где вы находитесь — не является приватной. За вами следят прямо затем, как вы читаете. Читать далее

Т: Математика в бизнесе

Честно — математика является мощнейшим инструментом для улучшения бизнеса. Мы решили вспомнить набор прагматичных применений математики в бизнесе из собственного опыта. Только того, что сами видели и делали как работающие решения.

Давайте посмотрим, что можно сделать проверенными способами до внедрения big data, AI и ML? То есть теорией игр, с добавлением регрессий, с линейным программированием, факторным анализом, поиском экстремумов функции и сценарными подходами в моделировании.

Раз пример. Теория игр для маркетинга. Читать далее

Н: Ружье, черепаха и десятый айфон.

Совершенно забавная новость, продолжающая рецензию про «оружие матемассического поражения», когда алгоритмы сильно ошибаются, прилетела в виде краткого видео. Черепаха или ружьё? Вам решать.

Суть проста. Машинное обучение подразумевает эволюционную дрессировку алгоритмов. Удалось — оставили решение, нет — поменяли подход. В части изображений это касается сравнения паттернов точек.

Поэтому получается, что для нас кошка, то для компьютера … гуакамоле. Читать далее