`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Андрей Зубинский

Продолжаем формировать «личные информационные завалы»

+99
голосов

Приёма, описанного в предыдущей записи, увы, категорически не хватает. По разным причинам. Поэтому я использую ещё один приём, с целой «технологической цепочкой», разовое формирование которой не требует особых усилий.

Начну с простого примера, чтобы было нагляднее. Захотелось мне по каким-то причинам сохранить вот эту страницу блога. Она для меня содержательна и, что немаловажно, приятно размечена – нет нужды всматриваться в мешанину текста и кода, пытаясь разобраться где там что:

Продолжаем формировать «личные информационные завалы»

Сохранённая в Pocket страница не так уж и плоха:

Продолжаем формировать «личные информационные завалы»

Если вы знаете LaTex, сможете прочитать формулы. Но даже если знаете, это не лучший вариант – почему-то даже прекрасно знающие LaTeX предпочитают распространять «читабельные» в естественной нотации документы, да и Tex – LaTex сделаны как раз для этой цели.
Попробуем «почистить» страницу штатным «чистильщиком» Clearly сервиса Evernote. Ой, «а где всё»?:

Продолжаем формировать «личные информационные завалы»

Если таким методом «не глядя» очистить страницу и сохранить её, увы, 90% сути утратится.

Ещё неприятнее, чем с MathML, обстоит дело с svg-иллюстрациями, которые «чистилками» и сервисами чаще всего превращаются в чудовищное невосстановимое месиво символов. И, как обычно, всегда «трудные» фрагменты – вставки исходных текстов (snippets), особенно с подсветкой синтаксиса. Всё это или исчезнет, или будет «перекорёжено» до непригодности, или «линеаризировано» в одну монохромную строку до нечитаемости. В таких случаях (и просто при больших документах, а они встречаются) без дополнительной ручной работы не обойтись.

Инструмент №0 – незаменимый лично для меня сервис с характрное анти-вебдванольным внятным названием PrintWhatYouLike. Это гибрид интерактивного «навигатора» по DOM страницы с оперативным редактором, который даёт возможность изолировать, удалять и изменять некоторые геометрические параметры элементов DOM. Сервис доступен с помощью букмарклета и практически не требует освоения – водим-«тырцаем» мышкой по странице, смотрим за подсвеченными красным блоками DOM, выбираем в появляющихся контекстных меню нужные действия (обычно сразу отыскивается и изолируется сутевой блок, потом он «подчищается» от излишеств):
После ручной «подчистки» получаем практически идеальный документ, без каких-либо излишеств и с полноценной сохранённой разметкой:

Продолжаем формировать «личные информационные завалы»

Можно попытаться скопировать его весь (Ctrl+A) и вставить новым документом в тот же Evernote, довольно часто получается очень хороший результат, но слова «довольно часто» означают, что также довольно часто получается не то, чего хочется. И тратить время на это нет смысла.

Мой подход другой. Я «печатаю» очищенный документ на виртуальном pdf-принтере (очевидная кнопка Print блока управления PrintWhatYouLike), на этом этапе всё, что от меня требуется – ввести более-менее вменяемое имя файла («вменяемость» определяется многими критериями, я игнорирую содержание и использую шаблон WebArt_YY_XX.XX.XXXX, где YY – номер, а XX.XX.XXXX – дата). И всегда получаю безукоризненный pdf-документ, с сохранённой разметкой и даже с URL оригинала в нижнем колонтитуле.

Продолжаем формировать «личные информационные завалы»

На этом этапе сделано всё, чтобы сформировать настоящую «файлопомойку» и потом в ней увлечённо копошиться. Но это не наш метод.

Свежеполученный документ добавляется в библиотеку Calibre. Это надо делать вручную. Как именно – не буду даже докучать, Calibre предельно простая в пользовании система. К особо интересным документам я даже не ленюсь подбирать «обложки» - механизмы редактирования метаданных Calibre это позволяют, а 3-5 минут на подбор поиском картинки, которая вызывает ассоциацию с содержимым файла, окупается потом сторицей, потому что одна из самых удобных навигаций по библиотеке Calibre – всё равно визуальная, «по обложкам» (они же прекрасно запоминаются).

Можно добавлять сохранённые pdf-файлы прямо в Evernote, оболочки сервиса располагают неплохими средствами, поддерживающими чтение инкапсулированных pdf-документов, но. «Распечатанные» в pdf файлы получаются не такими маленькими, как хотелось бы (приведенный пример «породил» почти мегабайтный документ), «напичкивать» Evernote таким большим нет смысла.

Calibre же даёт очень развитые средства управления метаданными документов (у «распечатанного» файла нет в метаданных обложки, авторов, тэгов, etc) и, главное, сервер удалённого доступа к библиотеке.

Так получается очень удобное собственное хранилище всяких полезных статей, открываем к  нему доступ из «внешнего мира» – и полная структурированная коллекция с развитым поиском всегда в кармане. Причём из неё можно «подбирать» только то, что требуется, без создания локального её «зеркала» на мобильном устройстве или ноутбуке.

Всё бы хорошо в этой системе. Кроме одного «но». Calibre – система большая и интерактивная, она для ведения библиотеки (что составляет менее 1% времени пользования ею) и только частично – для удалённого доступа к ней (а это – 99% времени). Держать ради доступа к библиотеке постоянно включённый «большой» компьютер нерационально. Надо экономить электроэнергию.

Посему пришлось добавить «стационарную интерактивную Calibre» отдельным Calibre-сервером на том самом стареньком нетбуке, который выбросить не поднимается рука. И синхронизировать каталоги библиотеки интерактивной и серверной Calibre. Есть всякие способы решения этой задачи, но я выбрал самый простой, требующий минимума действий. О них – в следующий раз, пока же скажу, что потребляющий 8 ватт никогда не выключающийся нетбук справляется со своей задачей «на отлично» - моя библиотека всегда со мной (через туннель ssh, точнее, Mosh, об этом тоже будет запись – почему, как и зачем) там, где есть доступ к сети. Всегда можно что-то нужное «подтянуть» из неё и потом уже читать локально.

К слову, я пробовал развернуть сервер Calibre (или его заменитель – COPS OPDS, тоже напишу о нём) на Raspberry Pi (это возможно), но результатами остался неудовлетворён. В реальном использовании Pi слабенькая для таких «программных бегемотиков». Так что чуда для любителей Pi в этом случае не выйдет.

Теперь о всяком высмотренном удивившем и забавном.
Не устаёт удивлять Microsoft. Уже и в Lenovo сообразили, где «новое большое поле со свежей травой», и создали подразделение IoT (и даже не побоялись после всех своих неисчислимых масштабных приобретений заявить, что «эпоха PC уже всё»), а в Microsoft всё идут какими-то странными, извилистыми путями, открывая крайне неожиданные проекты. Нет, ну действительно, позиционирование Sharks Cove в область «Internet of Things» – это, мягко говоря, очень странное позиционирование.

Продолжаем формировать «личные информационные завалы»

€239 за весьма заурядную материнскую плату с Intel Atom, созданную в союзе с Intel, это может относиться к какой угодно области, только не к IoT. Всё ещё интереснее, потому что в комплект входит инсталляция Windows 8.1. Которая и не RTOS, и не отличается компактностью, и вообще из «другой оперы». Что с этим будут делать те, кто уже «наелся» поисками ответа на этот же вопрос в возне с Raspberry Pi (которая хоть забавна, потому что копеечная и «сделай сам»), понятия и представления не имею. Для IoT-маршрутизаторов такой странный гибрид пользовательской ОС и уменьшенного (в смысле формата) commodity «железа» абсолютно не интересен – сейчас этих маршрутизаторов сколько угодно и какой угодно стоимости, никаких «сугубо IoT» аппаратных (в первую очередь интерфейсов) и программных решений в Sharks Cove нет. Я очень удивлён, и не только я. Тем более удивлён, что это же не первая попытка, до сих пор где-то «одинокая бродит Galileo», уже во второй ревизии.

Ну и о забавном. Сейчас такое время, когда забавное можно найти на каждом шагу. Например, было очень забавно наблюдать спокойное, без фанфар, празднование в США Дня Независимости, и тщательное игнорирование в русскоязычном пространстве незначительных фактов, «открывшихся» из этого празднования. Восполню пробел. В общем, США производят 75% всего того, что потребляют, рост промышленного производства достиг почти 2,4 триллиона долларов, а уровень производительности труда в промышленности такой, что количество занятых в ней снижается.

Продолжаем формировать «личные информационные завалы»

 

Продолжаем формировать «личные информационные завалы»

 

Что вы будете делать с этими знаниями – ума не приложу (а кошмарно-пионерское "с них надо брать пример" и вовсе уж будет издевательством), но это забавно в качестве противовеса «апокалипсическим картинкам», которые сейчас рисуются в неисчислимом количестве.

На сегодня всё

Откланиваюсь.

+99
голосов

Напечатать Отправить другу

Читайте также

Пример экстремального подхода к организации личных архивов и резервного копирования:
http://www.kinopoisk.ru/film/596001/

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT