Очередной конфуз в соцсетях, о гипотезах и, как обычно, немного пользы

13 декабрь, 2010 - 11:57Андрей Зубинский

В мире социальных сеточек очередной конфуз вышел. Суровые крякеры из команды Gnosis отломали всё что можно отломать серверам компании Gawker Media и утянули из руин 1,5 миллионов ников пользователей и паролей. А Gawker Media - это то, что прячется за Linkedin, например. 270 тысяч записей о поьзователях хулиганьё из Gnosis вывалили в публичный доступ. А вывод из этого какой? А вывод для меня лично такой - социальные сеточки, пока они баловство и "всем чьмоки в этом чати", совсем не так плохи по сравнению с цеховыми своими собратьями. Ребята, из утащенного в Linkedin можно вытянуть самые неожиданные и крайне неприятные знания, которые люди предпочитают прятать. Тысячу раз надо подумать прежде чем в такое вступать (это ведь не времена СССР, когда вступить можно было или в сами понимаете что, или в КПСС). Латентные связи между людьми на разных весьма немаленьких должностях, группы по интересам etc - за качественные гипотезы об этом всём определённые люди готовы платить весьма определённые деньги. Так что может быть в Gnosis и обиделись на Gawker Media за форчан (4chan), но сдаётся мне, что тут всё далеко не так просто, как кажется. Это ведь не данные об умалишённых весёлых фермерах утянули, это как бы готовая база данных по профессионалам в самых разных областях. Ну и, само собой, это весьма болезненная очередная шпилька бездумным сторонникам "повсеместной экономии на собственной инфраструктуре за счёт аренды чужой" (которое и есть, собственно, cloud computing).

К слову, насчёт гипотез. Я тут читаю много о Data Mining, книги вроде как серьёзные и умные, обычно на очевидную несуразность в общеходовом названии обращающие внимание с первых страниц:  Data - это сырые данные, и в результате Mining из них добывается совсем чуть-чуть (если вообще добывается) Knowledge. Об этом пишут. Но. Но-но-но. В результате любого статистического анализа получаются вовсе не знания. А гипотезы. О методах же эмпирических (вроде генетического программирования, нейронных сетей etc) вообще говорить нечего. И вот об этом как-то молчат. И из-за этой тонкой разницы, как я себе понимаю, и происходит большая катавасия, например, даже в немудрёных системах "удержания потребителя", которые кроме как донимают несчастного "удерживаемого" идиотической назойливостью потребителя, никакой конкретной пользы в реальности ему не дают. Дорогие дэйтамайнеры! Вы не знания вытягиваете! Вы формируете гипотезы! Не забывайте об этом. Никогда. А то в отрасли случится кризис. Там, где путают факты со знаниями и гиптезами - непременно случаются кризисы.

Теперь польза. Есть её немного.

Совершенно замечательная интерактивная среда-самоучитель программирования на язке Scala -  Kojo. Море удовольствия. В общем, тут говорить много нечего. Scala - язык очень мощный и непростой, но достойный изучения по множеству причин. А с такой чудесной поддержкой изучения он превращается в увлекательную компьютерную игру.

Ну и подарок для не забывших кто такой Никлас Вирт - позавчера вышел очередной релиз системы программирования GNU Modula-2. Кто проходил через Modula (о эти времена TopSpeed, если вам о чём-то говорит название), тот равнодушным не останется.

Ну и для гиков и фриков милейшай утилитка - графический редактор ASCII-картинок Jave. В отличие от многого - интерактивный. Можно рисовать ASCII-арт. Зачем это делать? Ну, хотя бы потому, что в некоторых специфических цеховых объединениях это просто принято делать. Так требует субкультура.

Ну и ещё один, пока сырой, в стадии разработки графический (уже нормальный) редактор Leonardo. В его основе - очень приятная библиотека Amino (графика и GUI), да и сейчас уже Leonardo вполне годный.

Пока всё. Разве что попалась на глазасобачка-робот из Швейцарии, вспомнилось "Собачье сердце" - "странница я, из Пскова, на говорящую собачку пришла посмотреть". Оно того стоит, интересный проект.