В мире социальных сеточек очередной конфуз вышел. Суровые крякеры из команды Gnosis отломали всё что можно отломать серверам компании Gawker Media и утянули из руин 1,5 миллионов ников пользователей и паролей. А Gawker Media - это то, что прячется за Linkedin, например. 270 тысяч записей о поьзователях хулиганьё из Gnosis вывалили в публичный доступ. А вывод из этого какой? А вывод для меня лично такой - социальные сеточки, пока они баловство и "всем чьмоки в этом чати", совсем не так плохи по сравнению с цеховыми своими собратьями. Ребята, из утащенного в Linkedin можно вытянуть самые неожиданные и крайне неприятные знания, которые люди предпочитают прятать. Тысячу раз надо подумать прежде чем в такое вступать (это ведь не времена СССР, когда вступить можно было или в сами понимаете что, или в КПСС). Латентные связи между людьми на разных весьма немаленьких должностях, группы по интересам etc - за качественные гипотезы об этом всём определённые люди готовы платить весьма определённые деньги. Так что может быть в Gnosis и обиделись на Gawker Media за форчан (4chan), но сдаётся мне, что тут всё далеко не так просто, как кажется. Это ведь не данные об умалишённых весёлых фермерах утянули, это как бы готовая база данных по профессионалам в самых разных областях. Ну и, само собой, это весьма болезненная очередная шпилька бездумным сторонникам "повсеместной экономии на собственной инфраструктуре за счёт аренды чужой" (которое и есть, собственно, cloud computing).

К слову, насчёт гипотез. Я тут читаю много о Data Mining, книги вроде как серьёзные и умные, обычно на очевидную несуразность в общеходовом названии обращающие внимание с первых страниц: Data - это сырые данные, и в результате Mining из них добывается совсем чуть-чуть (если вообще добывается) Knowledge. Об этом пишут. Но. Но-но-но. В результате любого статистического анализа получаются вовсе не знания. А гипотезы. О методах же эмпирических (вроде генетического программирования, нейронных сетей etc) вообще говорить нечего. И вот об этом как-то молчат. И из-за этой тонкой разницы, как я себе понимаю, и происходит большая катавасия, например, даже в немудрёных системах "удержания потребителя", которые кроме как донимают несчастного "удерживаемого" идиотической назойливостью потребителя, никакой конкретной пользы в реальности ему не дают. Дорогие дэйтамайнеры! Вы не знания вытягиваете! Вы формируете гипотезы! Не забывайте об этом. Никогда. А то в отрасли случится кризис. Там, где путают факты со знаниями и гиптезами - непременно случаются кризисы.

Теперь польза. Есть её немного.

Совершенно замечательная интерактивная среда-самоучитель программирования на язке Scala - Kojo. Море удовольствия. В общем, тут говорить много нечего. Scala - язык очень мощный и непростой, но достойный изучения по множеству причин. А с такой чудесной поддержкой изучения он превращается в увлекательную компьютерную игру.

Ну и подарок для не забывших кто такой Никлас Вирт - позавчера вышел очередной релиз системы программирования GNU Modula-2. Кто проходил через Modula (о эти времена TopSpeed, если вам о чём-то говорит название), тот равнодушным не останется.

Ну и для гиков и фриков милейшай утилитка - графический редактор ASCII-картинок Jave. В отличие от многого - интерактивный. Можно рисовать ASCII-арт. Зачем это делать? Ну, хотя бы потому, что в некоторых специфических цеховых объединениях это просто принято делать. Так требует субкультура.

Ну и ещё один, пока сырой, в стадии разработки графический (уже нормальный) редактор Leonardo. В его основе - очень приятная библиотека Amino (графика и GUI), да и сейчас уже Leonardo вполне годный.

Пока всё. Разве что попалась на глазасобачка-робот из Швейцарии, вспомнилось "Собачье сердце" - "странница я, из Пскова, на говорящую собачку пришла посмотреть". Оно того стоит, интересный проект.

Стратегія охолодження ЦОД для епохи AI

Напечатать Отправить другу

Читайте также

Пост-Муровий ренесанс
[27 мая] – Тимур Ягофаров
Розмови з Claude
[18 мая] – Sergey Petrenko
Емерджентність — від соціальної концепції до цифрової неминучості (частина 2) • [17 мая] – Денис Хлєбосолов
Емерджентність - від соціальної концепції до цифрової неминучості • [12 мая] – Денис Хлєбосолов
Як терагерцові хвилі «бачать» роботу транзисторів
[29 апреля] – Тимур Ягофаров

Андрей Зубинский - все записи блога
Войдите или зарегистрируйтесь, чтобы вы могли писать комментарии
Подписаться на тип материалов: блог
Подписаться на обсуждение сообщения
Подписаться на этот блог

Михаил Корбаков | 13 декабря 2010 г., 13:07 | ссылка

О! За Kojo -- большое спасибо, буду баловаться.
Большая проблема для сложных языков типа Scala -- на игрушечных проектах обкатывать смысла нету, особых преимуществ не почувствуешь, а на большие опыта использования не хватает. Так и зависают чисто теоретические знания в голове.

Войдите или зарегистрируйтесь, чтобы вы могли писать комментарии

Ілля Корнійко | 19 декабря 2010 г., 14:31 | ссылка

прекрасно все почувствуешь, надо только попробовать. а там и к большим понемногу перейти можно, которые на Скале писать гораздо проще

Войдите или зарегистрируйтесь, чтобы вы могли писать комментарии

Геннадий Блиндер | 13 декабря 2010 г., 16:59 | ссылка

Андрей, а Вам случайно не попадался на глаза какой-нибудь средних размеров OpenSource проект на Scala с GUI?

А то по документации и двум главам в "Programming in Scala" не очень-то получается разобраться с тамошним Swing'ом... :(

Войдите или зарегистрируйтесь, чтобы вы могли писать комментарии

Владимир Демчук | 13 декабря 2010 г., 23:41 | ссылка

отсюда http://www.ibm.com/developerworks/ru/library/j-scala05298/ взята ссылка на проект OOPScala https://lampsvn.epfl.ch/trac/scala/browser/scala-experimental/trunk/OOPS...

Войдите или зарегистрируйтесь, чтобы вы могли писать комментарии

Олег Яковлев | 13 декабря 2010 г., 19:36 | ссылка

Так что, бежать в линкедине пароль менять? Или уже пофигу? :(

Войдите или зарегистрируйтесь, чтобы вы могли писать комментарии

Андрей Носенко | 14 декабря 2010 г., 0:31 | ссылка

Проблема не в замене пароля на LinkedIn (допустим он тоже Gawker), а в том, что люди часто используют один и тот же пароль для множества сайтов. Соотв. им теперь надо менять все пароли, совпадающие с паролем Gawker. Twitter, например (http://www.theregister.co.uk/2010/12/13/twitter_diet_spam_gawker_comprom...)

Войдите или зарегистрируйтесь, чтобы вы могли писать комментарии

Анатолий Павлюченко | 14 декабря 2010 г., 15:13 | ссылка

Добавлю, "что люди часто используют один и тот же пароль" и один и тот же почтовый адрес " для множества сайтов". А представители LinkedIn проводят профилактические работы, сравнивая выложенную базу почтовых адресов и свою базу. Т.е. сама база LinkedIn не пострадала, как написал автор, т.к. она не использует Gawker. Иначе шума было бы намного больше.
P.S. По крайней мере я не смог найти ни одного упоминания о том, что LinkedIn использует Gawker.

Войдите или зарегистрируйтесь, чтобы вы могли писать комментарии

Иван Федорец | 13 декабря 2010 г., 21:21 | ссылка

Андрей,
можно ссылку на источник информации о том, что Gawker Media "держит" базу аккаунтов для Linkedin?
чёт Гугл молчит на этот счет..да и Linkedin тоже, в отличие от Lifehacker

Войдите или зарегистрируйтесь, чтобы вы могли писать комментарии

Анатолий Павлюченко | 14 декабря 2010 г., 15:15 | ссылка

Написал чуть выше. Скорее всего, автор ошибся. Или ждём proof link.

Войдите или зарегистрируйтесь, чтобы вы могли писать комментарии

Volodymyr Lazurenko | 14 декабря 2010 г., 13:40 | ссылка

Да-да, таки гипотезы, о структуре и свойствах неизвестного количества образов. И синтезированная конечная модель к тому же должна включать модель потребителя с бесконечной рефлексией.

Порекомендуйте, пожалуйста, по результатам датамайнинга предметной области,
что стоит серьёзного, по Вашему мнению, почитать-посмотреть про датамайнинг\распознавание.

Да. Мой критерий серьёзности прост:
содержательные модели,
изначально с корректной постановкой задачи (например, понимания противоречивости существования всеведущего и всемогущего одновременно, или невозможности решения задачи абсолютного предвидения в менеджменте при ограниченных ресурсах)
и заканчивая елементарным знанием авторов полезных данных доступных на данный момент научных результатов
(например, бессмысленность анализа применения из-за парадокса Эрроу для декларируемых задач открытых партийных списков на выборах; майнинга мудрости интернетов для синтеза знаний по экзистенциальной философии или структурализму, поскольку все адекватные модели уже построены польской математической школой в 70-х и др и пр.).
Я конечно же не серьёзно. стебусь,
кроме второго абзаца.

Войдите или зарегистрируйтесь, чтобы вы могли писать комментарии

Anton Kolomyeytsev | 22 декабря 2010 г., 13:29 | ссылка

Вывод непонятен совершенно. Ну, уперли... Так всегда воровали и воруют. Кредитки тоже воруют. Чего теперь, с мешком кеша и двумя пистолетами по планете кататься? Не вариант. Социальные сети - зло? Ну, ОК... Не регистрируйся в них. Кто мешает их при этом использовать для своих нужд?