`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Андрей Зубинский

Очередной конфуз в соцсетях, о гипотезах и, как обычно, немного пользы

+1414
голосов

В мире социальных сеточек очередной конфуз вышел. Суровые крякеры из команды Gnosis отломали всё что можно отломать серверам компании Gawker Media и утянули из руин 1,5 миллионов ников пользователей и паролей. А Gawker Media - это то, что прячется за Linkedin, например. 270 тысяч записей о поьзователях хулиганьё из Gnosis вывалили в публичный доступ. А вывод из этого какой? А вывод для меня лично такой - социальные сеточки, пока они баловство и "всем чьмоки в этом чати", совсем не так плохи по сравнению с цеховыми своими собратьями. Ребята, из утащенного в Linkedin можно вытянуть самые неожиданные и крайне неприятные знания, которые люди предпочитают прятать. Тысячу раз надо подумать прежде чем в такое вступать (это ведь не времена СССР, когда вступить можно было или в сами понимаете что, или в КПСС). Латентные связи между людьми на разных весьма немаленьких должностях, группы по интересам etc - за качественные гипотезы об этом всём определённые люди готовы платить весьма определённые деньги. Так что может быть в Gnosis и обиделись на Gawker Media за форчан (4chan), но сдаётся мне, что тут всё далеко не так просто, как кажется. Это ведь не данные об умалишённых весёлых фермерах утянули, это как бы готовая база данных по профессионалам в самых разных областях. Ну и, само собой, это весьма болезненная очередная шпилька бездумным сторонникам "повсеместной экономии на собственной инфраструктуре за счёт аренды чужой" (которое и есть, собственно, cloud computing).

К слову, насчёт гипотез. Я тут читаю много о Data Mining, книги вроде как серьёзные и умные, обычно на очевидную несуразность в общеходовом названии обращающие внимание с первых страниц:  Data - это сырые данные, и в результате Mining из них добывается совсем чуть-чуть (если вообще добывается) Knowledge. Об этом пишут. Но. Но-но-но. В результате любого статистического анализа получаются вовсе не знания. А гипотезы. О методах же эмпирических (вроде генетического программирования, нейронных сетей etc) вообще говорить нечего. И вот об этом как-то молчат. И из-за этой тонкой разницы, как я себе понимаю, и происходит большая катавасия, например, даже в немудрёных системах "удержания потребителя", которые кроме как донимают несчастного "удерживаемого" идиотической назойливостью потребителя, никакой конкретной пользы в реальности ему не дают. Дорогие дэйтамайнеры! Вы не знания вытягиваете! Вы формируете гипотезы! Не забывайте об этом. Никогда. А то в отрасли случится кризис. Там, где путают факты со знаниями и гиптезами - непременно случаются кризисы.

Теперь польза. Есть её немного.

Совершенно замечательная интерактивная среда-самоучитель программирования на язке Scala -  Kojo. Море удовольствия. В общем, тут говорить много нечего. Scala - язык очень мощный и непростой, но достойный изучения по множеству причин. А с такой чудесной поддержкой изучения он превращается в увлекательную компьютерную игру.

Ну и подарок для не забывших кто такой Никлас Вирт - позавчера вышел очередной релиз системы программирования GNU Modula-2. Кто проходил через Modula (о эти времена TopSpeed, если вам о чём-то говорит название), тот равнодушным не останется.

Ну и для гиков и фриков милейшай утилитка - графический редактор ASCII-картинок Jave. В отличие от многого - интерактивный. Можно рисовать ASCII-арт. Зачем это делать? Ну, хотя бы потому, что в некоторых специфических цеховых объединениях это просто принято делать. Так требует субкультура.

Ну и ещё один, пока сырой, в стадии разработки графический (уже нормальный) редактор Leonardo. В его основе - очень приятная библиотека Amino (графика и GUI), да и сейчас уже Leonardo вполне годный.

Пока всё. Разве что попалась на глазасобачка-робот из Швейцарии, вспомнилось "Собачье сердце" - "странница я, из Пскова, на говорящую собачку пришла посмотреть". Оно того стоит, интересный проект.

+1414
голосов

Напечатать Отправить другу

Читайте также

О! За Kojo -- большое спасибо, буду баловаться.
Большая проблема для сложных языков типа Scala -- на игрушечных проектах обкатывать смысла нету, особых преимуществ не почувствуешь, а на большие опыта использования не хватает. Так и зависают чисто теоретические знания в голове.

прекрасно все почувствуешь, надо только попробовать. а там и к большим понемногу перейти можно, которые на Скале писать гораздо проще

Андрей, а Вам случайно не попадался на глаза какой-нибудь средних размеров OpenSource проект на Scala с GUI?

А то по документации и двум главам в "Programming in Scala" не очень-то получается разобраться с тамошним Swing'ом... :(

Так что, бежать в линкедине пароль менять? Или уже пофигу? :(

Проблема не в замене пароля на LinkedIn (допустим он тоже Gawker), а в том, что люди часто используют один и тот же пароль для множества сайтов. Соотв. им теперь надо менять все пароли, совпадающие с паролем Gawker. Twitter, например (http://www.theregister.co.uk/2010/12/13/twitter_diet_spam_gawker_comprom...)

Добавлю, "что люди часто используют один и тот же пароль" и один и тот же почтовый адрес " для множества сайтов". А представители LinkedIn проводят профилактические работы, сравнивая выложенную базу почтовых адресов и свою базу. Т.е. сама база LinkedIn не пострадала, как написал автор, т.к. она не использует Gawker. Иначе шума было бы намного больше.
P.S. По крайней мере я не смог найти ни одного упоминания о том, что LinkedIn использует Gawker.

Андрей,
можно ссылку на источник информации о том, что Gawker Media "держит" базу аккаунтов для Linkedin?
чёт Гугл молчит на этот счет..да и Linkedin тоже, в отличие от Lifehacker

Написал чуть выше. Скорее всего, автор ошибся. Или ждём proof link.

Да-да, таки гипотезы, о структуре и свойствах неизвестного количества образов. И синтезированная конечная модель к тому же должна включать модель потребителя с бесконечной рефлексией.

Порекомендуйте, пожалуйста, по результатам датамайнинга предметной области,
что стоит серьёзного, по Вашему мнению, почитать-посмотреть про датамайнинг\распознавание.

Да. Мой критерий серьёзности прост:
содержательные модели,
изначально с корректной постановкой задачи (например, понимания противоречивости существования всеведущего и всемогущего одновременно, или невозможности решения задачи абсолютного предвидения в менеджменте при ограниченных ресурсах)
и заканчивая елементарным знанием авторов полезных данных доступных на данный момент научных результатов
(например, бессмысленность анализа применения из-за парадокса Эрроу для декларируемых задач открытых партийных списков на выборах; майнинга мудрости интернетов для синтеза знаний по экзистенциальной философии или структурализму, поскольку все адекватные модели уже построены польской математической школой в 70-х и др и пр.).
Я конечно же не серьёзно. стебусь,
кроме второго абзаца.

Вывод непонятен совершенно. Ну, уперли... Так всегда воровали и воруют. Кредитки тоже воруют. Чего теперь, с мешком кеша и двумя пистолетами по планете кататься? Не вариант. Социальные сети - зло? Ну, ОК... Не регистрируйся в них. Кто мешает их при этом использовать для своих нужд?

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT