Tagged: анализ информации
Рецензия: Big Data 3/5 и 9%
Термин Big Data не имеет сложившегося определения. Но последние три года он активно используется где угодно и где неугодно. Одноименная книга использует два определения. Одно логически неправильное, другое логически правильное. Первое: “Большие данные – это то, что можно сделать по-большому, и нельзя сделать по-маленькому”. Второе: “Когда выборка данных для анализа равна генеральной совокупности”. 
Первые 100 страниц имеют 8 закладок, или 8% содержательности. Всего на 205 страниц 19 закладок, или 9% содержательности. Оценка 3/5.
Чтобы попытаться уйти от критики, автор сразу делает оговорку, что причинно-следственные связи Big Data не интересуют, а только корреляции.
Почему автор игнорирует тематику причинно-следственных связей между входами больших данных и выходами из их анализа? Две причины: когда вводных и выводных параметров тысячи-миллионы, то попробовать объяснить найденную корреляцию весьма затруднительно; также вполне вероятны случайные корреляции, которые объяснять нет смысла. Поэтому проще игнорировать.