Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Большая распродажа
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
Веб-сервисы
14 июня 2016

LJSear.ch — сервис для тех, кому нужны архивы «Живого журнала»

Хотите найти в «ЖЖ» запись столетней давности, но не можете, потому что возможности поиска ограничены одним месяцем? Вам поможет бесплатный сервис LJSear.ch, в котором собраны архивы русскоязычной части LiveJournal за 2000–2015 годы. Расскажет о нём его создатель Роман Иванов (kukutz).
Фото автора Лиля Леднёва
Лиля Леднёва

LJSear.ch — сервис для тех, кому нужны архивы «Живого журнала»

Роман Иванов

Менеджер по продуктам в «Яндексе». Запустил поиск по блогам, персональный поиск «Яндекса», несколько версий «Яндекс.Почты», сервисы «Яндекс.Лента»,«Я.ру», «Яндекс.Фотки» и ряд других. Сейчас занимается «Яндекс.Браузером» и LJSear.ch.

Что такое LJSear.ch?

Это более терабайта архивов «ЖЖ». Проиндексированы и доступны для поиска 340 миллионов постов и 1 миллиард комментариев с 2000-го по осень 2015 года. И всё это с привычными для поиска по блогам инструментами: ограничение по автору, по дате, по сообществу.

Новые записи не индексируются, поскольку мы рассматриваем наш проект как архивный, мемориальный.

Проект полностью некоммерческий, никакой рекламы и иных способов заработка не предполагает.

Зачем нужен сервис?

Осенью 2015 года возможности поиска по блогам «Яндекса» были ограничены только последним месяцем. Объяснение было простым: подавляющее большинство пользователей ищет информацию, связанную с недавними записями, и глубокий поиск для них избыточен.

Это правда. Последнего месяца достаточно для задач вроде регулярного vanity search или мониторинга отзывов о каком-то свежем событии. Но есть задачи и более глубокие, исследовательские.

Я считаю, что в «ЖЖ» случилась или как минимум нашла своё отражение почти вся русскоязычная культура нулевых годов. Значение этого архива трудно переоценить. Когда «Яндекс» закрыл поиск по архивам, я очень огорчился, поскольку убеждён, что это собрание информации должно быть сохранено для человечества. Ну и попросил у «Яндекса» архивы, а он внезапно согласился и дал их.

Архивы поиска по блогам совершенно уникальны, потому что очень многое уже нельзя скачать в самом «ЖЖ». Многие журналы удалены их авторами, некоторые взломаны и уничтожены хакерами, в некоторых случаях записи не удалены, но спрятаны под замок.

Последние полгода на мне лежала ответственность за то, чтобы эти данные не пропали. Я позвал на помощь друзей, и среди них нашлись те, кто согласился помочь понять, можно ли сделать информацию доступной для поиска. Мы создали сервис LJSear.ch и вроде бы довели его до вменяемого состояния.

Добровольцев оказалось много?

Нашлись. Известный специалист в области UX Коля Заярный придумал дизайн. Саша Белянский взялся за БЭМ-вёрстку и фронтенд на Node.js. Spaceinvaderz занялся системным администрированием. Программировать бэкенд на PHP я стал сам на базе прототипа, который сделал мой друг tobe.

Самой большой проблемой было железо: кто будет платить за хостинг? Друзья уверяли, что можно собрать деньги на краудфандинговых площадках, но я был настроен скептически. И тут на нас вышли прекрасные люди из Servers.ru и предложили помочь. В итоге у нас отличный выделенный сервер с SSD для индекса и бэкенда поиска плюс облачный виртуальный сервер для фронтенда.

Кому может быть интересен проект?

Поскольку новые записи не индексируются, то аудитория, на которую я рассчитываю, — это исследователи. Как в прямом смысле слова исследователи культурных пластов нулевых годов, так и просто настоящие или бывшие пользователи «ЖЖ», которые хотят найти что-то, что было написано в те годы. А потому я не стал ограничивать максимальное время выполнения поискового запроса: исследователь может подождать выполнения сложного запроса и минуту, и две. При этом, конечно, простые запросы выполняются быстро, а если сервис обнаруживает, что запросов сейчас много, он включает управляемую деградацию, в том числе ограничивает тайм-аут запроса.

LJSear.ch →

Обложка: photominus/depositphotos.com
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

Где отдохнуть летом в России

Где отдохнуть летом в России: 7 необычных мест

Надо брать: набор из 228 инструментов от Deko со скидкой 66%

Надо брать: набор из 228 предметов от Deko со скидкой 66%

10 товаров, чтобы сделать кухню лучшим местом в доме

10 товаров, чтобы сделать кухню лучшим местом в доме

Моющий пылесос Roborock F25 Ultra

Надо брать: моющий пылесос Roborock F25 Ultra со скидкой 45%

15 товаров, которые обидно упускать с такими скидками на распродаже AliExpress

15 товаров, которые обидно упускать с такими скидками на распродаже AliExpress

Надо брать: кроссовки от Li-Ning для мокрой весны и нежаркого лета

Надо брать: кроссовки от Li-Ning для мокрой весны и нежаркого лета

Надо брать: мощная автомобильная зарядка от Ugreen со скидкой 48%

Надо брать: мощная автомобильная зарядка от Ugreen со скидкой 48%

Техника, которую стоит купить сейчас, чтобы не жалеть об упущенной выгоде

Техника, которую стоит купить сейчас, чтобы не жалеть об упущенной выгоде

Это интересно
«Горящая изба» и TRENDY BOX выпустили бьюти-бокс «Сияй!» — и это очень красивый набор косметики

«Горящая изба» и TRENDY BOX выпустили бьюти-бокс «Сияй!» — и это очень красивый набор косметики

Меньше места — больше возможностей: 5 причин купить посуду Tefal Ingenio со съёмной ручкой

Меньше места — больше возможностей: 5 причин купить посуду Tefal Ingenio со съёмной ручкой

Реклама
Как сегодня в России создают новые лекарства и учатся «заживлять» трещины в металле

Как сегодня в России создают новые лекарства и учатся «заживлять» трещины в металле

Как женщины-учёные выводят науку за пределы лабораторий: 3 идеи, которые двигают прогресс

Как женщины-учёные выводят науку за пределы лабораторий: 3 идеи, которые двигают прогресс

Комментарии

Станьте первым, кто оставит комментарий

Что вы могли пропустить
Кошмар зумера: экс-дизайнер Apple создал аналоговый будильник без стрелок
Кошмар зумера: экс-дизайнер Apple создал аналоговый будильник без стрелок
0
19:40
Новости
Устройства
Три в одном: Xiaomi показала потолочный обогреватель с вытяжкой и лампой
Три в одном: Xiaomi показала потолочный обогреватель с вытяжкой и лампой
0
16:50
Новости
Устройства
Мессенджер BiP: как пользоваться турецким аналогом Telegram и WhatsApp
Мессенджер BiP: как пользоваться турецким аналогом Telegram и WhatsApp
0
10:00
Технологии
Технологии
Xiaomi выпустила часы Watch S5 с увеличенным экраном, eSIM и автономностью до 21 дня
Xiaomi выпустила часы Watch S5 с увеличенным экраном, eSIM и автономностью до 21 дня
0
Вчера
Новости
Устройства
Xiaomi представила тонкий и лёгкий премиум-ноутбук Book Pro 14
Xiaomi представила тонкий и лёгкий премиум-ноутбук Book Pro 14
0
Вчера
Новости
Устройства
Надо брать: мощная автомобильная зарядка от Ugreen со скидкой 48%
Надо брать: мощная автомобильная зарядка от Ugreen со скидкой 48%
0
Вчера
Покупки
Устройства
«Яндекс» научит писать курсовые и дипломы с помощью ИИ
«Яндекс» научит писать курсовые и дипломы с помощью ИИ
0
Вчера
Новости
Технологии
«30% выпускников не найдут работу»: глава ServiceNow спрогнозировал безработицу из-за ИИ
«30% выпускников не найдут работу»: глава ServiceNow спрогнозировал безработицу из-за ИИ
0
Вчера
Новости
Технологии
«Интернетометр» от «Яндекса» для проверки скорости интернета вышел на iOS и Android
«Интернетометр» от «Яндекса» для проверки скорости интернета вышел на iOS и Android
0
Вчера
Android
iOS
Как экспортировать данные из Telegram, чтобы не потерять переписки, сообщения в каналах и файлы
Как экспортировать данные из Telegram, чтобы не потерять переписки, сообщения в каналах и файлы
0
Вчера
Технологии
Технологии
ИИ-браузер Comet от Perplexity вышел на iPhone — с голосовым поиском
ИИ-браузер Comet от Perplexity вышел на iPhone — с голосовым поиском
0
Вчера
iOS
Браузеры
«Найди нам с котиком квартиру в центре» и другие запросы, с которыми справится ИИ-помощник Яндекс Недвижимости
«Найди нам с котиком квартиру в центре» и другие запросы, с которыми справится ИИ-помощник Яндекс Недвижимости
Вчера
Технологии
Технологии
Вместо Figma: Google превратила сервис Stitch в платформу для «вайб-дизайна»
Вместо Figma: Google превратила сервис Stitch в платформу для «вайб-дизайна»
0
Вчера
Веб-сервисы
Новости
Минцифры России опубликовало законопроект о регулировании ИИ — он вводит понятие суверенной модели
Минцифры России опубликовало законопроект о регулировании ИИ — он вводит понятие суверенной модели
0
Вчера
Новости
Технологии
«Живой поиск» в Google теперь доступен всем пользователям
«Живой поиск» в Google теперь доступен всем пользователям
0
18 марта
Новости
Технологии

Новые комментарии

Аватар автора комментария
Dima Khorokhordin38 минут назад

0 / 0

Да хватит уже, миледи. «Вам не нравятся кошки? — Вы просто не умеете их готовить». Идите в настройки Personalization __Custom instructions__ Первый промпт: System Instruction: High-Density Mode Eliminate: - вода, эмоции, риторика, CTA, разговорные переходы Assume: - пользователь воспринимает сжатую и прямую информацию Prioritize: - точность > жёсткость - логика > форма Behavior: - не выдумывать - не имитировать уверенность - явно фиксировать границы знания - не подменять отсутствие данных догадками Uncertainty: - при нехватке данных: 1) указать ограничение 2) дать ответ в рамках известного 3) задать 1 уточняющий вопрос, если критично Style: - кратко, структурно, без повторов - без самореференций End: - завершать ответ без лишнего Второй промпт: ___More about you___ Rules: 1. Выступай как профильный эксперт. 2. Давай точные, структурированные, неповторяющиеся ответы. 3. Приоритизируй суть вопроса над формой. 4. Не используй дисклеймеры и самореференции. 5. Не выдумывай факты и не давай ложную точность. 6. Если данных недостаточно — прямо укажи это. 7. Разделяй факты, выводы и оценки. 8. При неоднозначности — задай 1 уточняющий вопрос. 9. Для сложных тем — краткое объяснение без потери точности. 10. Допустимо указание уверенности: низкая / средняя / высокая. 11. Несколько решений — только если это реально добавляет точность. 12. Не использовать эмоциональные смягчения и риторику. 13. Не повторять очевидное. 14. Ответ по умолчанию: русский язык. Не благодарите.
Личный опыт: манипуляции, газлайтинг и унижение от ChatGPT
Аватар автора комментария
Максим Прохоров56 минут назад

0 / 0

и че?
Продакшен-директор Лайфхакера Анна Крачек выступила на «Дне Бренда» от AdIndex
Аватар автора комментария
Vlad Kto-To1 час назад

0 / 0

Установил антивирус Dr. Web , а удалив его увидел файлы , которые невозможно удалить . Некрасиво получается , это что-то вроде невозможно полностью удалить нежеланного гостя. То-же самое с Касперским .
7 лучших бесплатных антивирусов
Аватар автора комментария
Константин Мищенко1 час назад

0 / 0

если гнобить и бить мужика, изменять. Сомневаюсь что он будет счастлив. Представьте подходит к вам родной человек и начинает душить сзади? Мне вот не приятно было.
Почему не платить алименты — мерзко
Как найти покупателей без помощи социальных сетей

Как найти покупателей без помощи социальных сетей

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииО компании
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях