Habr.com

Ленты новостей Хабр
Все публикации подряд на Хабре
Обновлено: 19 мин. 49 сек. назад

Жребий брошен: оптимальная генерация распределений и алгоритм Кнута-Яо

ср, 07/02/2025 - 18:26

Задача
Три айтишника — Маша, Вася и Петя — пошли в поход. После ужина они решают, кто будет мыть посуду. Петя дежурит один, а Маша с Васей — вдвоём. Значит, нужно выбрать Петю с вероятностью ⅓, а Машу с Васей — с вероятностью ⅔. Под рукой — только честная монетка. Как с её помощью устроить такой жребий?

Когда мы обсуждали эту задачу со студентами, они предложили такой способ. Бросим монету дважды: если выпали два орла — дежурит Петя; если один орёл и одна решка — Маша с Васей; если две решки — перебрасываем

Чтобы выбрать дежурного так, в среднем уходит 8⁄3 броска (чуть позже мы это докажем). Можно ли сделать это быстрее? Существует ли алгоритм, для которого ожидаемое число бросков меньше?

Оказывается, можно придумать простой, но неочевидный метод, позволяющий смоделировать событие с вероятностью ⅓ — и в среднем требует не больше двух бросков. Он называется алгоритмом Кнута–Яо

В этой статье мы пройдём весь путь к этому алгоритму. Начнём с базовых методов, поймем, сколько бросков они требуют в среднем, и найдём границу, быстрее которой не может работать никакой алгоритм. А затем построим тот, который этой границы достигает — оптимальный для вероятности ⅓

В финале мы обобщим эту идею: научимся моделировать любую вероятность p от 0 до 1 — и любое дискретное распределение. Заодно познакомимся с важным понятием, называемым энтропией

А в самом конце, как всегда — красивая задача

Читать далее

Карты Tenstorrent для DIY-сервера с локальной LLM

ср, 07/02/2025 - 18:01

В апреле 2025 года компания Tenstorrent начала принимать заказы на PCIe-карты Blackhole и Wormhole (на фото). Ускорители TPU на открытой архитектуре RISC-V с 28−32 ГБ видеопамяти предназначены непосредственно для разработчиков, которые желают запускать LLM на домашнем ПК или небольшом DIY-сервере. Это реальная альтернатива в сегменте, где пока доминирует Nvidia.

Во главе Tenstorrent стоит легендарный инженер Джим Келлер, ветеран Intel и AMD, создатель микроархитектуры AMD Zen и соавтор x86-64.

Благодаря радикальной открытости своих решений Tenstorrent уже привлекла небольшую армию фанатов среди LLM-энтузиастов.

Читать далее

OpenBao: немного enterprise'ных возможностей при управлении секретами

ср, 07/02/2025 - 17:59

С момента смены лицензирования Hashicorp Vault утекло много времени и с момента появления проекта OpenBao, мы регулярно следили за его судьбой. Несколько дней назад завезли enterprise-функционал, который доступен безвозмездно. И хотелось бы поделиться этой информацией с сообществом

Съесть еще этих мягких булок

Apache Kafka в интеграционных задачах КРУПНОГО бизнеса: какие плюсы и слабые стороны у такого подхода?

ср, 07/02/2025 - 17:56

Apache Kafka в интеграционных задачах КРУПНОГО бизнеса: какие плюсы и слабые стороны у такого подхода? И какие дополнительные инструменты стоит подключить, чтобы избавиться от всех проблем в интеграциях?

Читать далее

Открытый и опасный: как снизить риски open-source в приложениях

ср, 07/02/2025 - 17:54

Всем привет!

Опен-сорс и почему в российских ПО появляется код из библиотек, расположенных на серверах из недружественных юрисдикций – самая модная тема сезона.

Поэтому Владимир Высоцкий, руководитель по развитию бизнеса продукта Solar appScreener, в этом материале решил напомнить об основных рисках открытого кода и как их можно избежать на этапе разработки вашего продукта.

Читать далее

BDUI: эволюция динамических интерфейсов

ср, 07/02/2025 - 17:38

Привет, Хабр! В России набирает популярность новый подход к созданию пользовательских интерфейсов — Backend Driven UI (BDUI). В нём сервер задаёт структуру и поведение интерфейса, а приложение просто отображает его на экране.

BDUI уже используют в своих приложениях многие коллеги из индустрии. Меня зовут Елена Зеликсон, я старший инженер по тестированию в VK. О том, какие преимущества у этого решения и как его применять, подробнее расскажу в этой статье.

Читать далее

Gaunt Sloth — Open Source AI CLI утилита

ср, 07/02/2025 - 17:31

Прошло довольно много времени с тех пор, как я в последний раз что-либо публиковал на Хабре, около 10 лет или около того, и сегодня настал день, чтобы поделиться своим небольшим Open Source проектом.

Проект под названием Gaunt Sloth Assistant — это CLI-клиент для ИИ (AI), созданный на TypeScript (LangChain.js), распространяемый через npm и работающий в Linux, Windows и Mac. Пользователь полностью контролирует промпты, и рекомендуется формировать свои собственные системные промпты, но у него также есть и стандартный.

основные команды:

- Review PR 42 сверяя с требованиями из issue 12 gth pr 42 12
- Review local diff git --no-pager diff | gth review
- Interactive chat gth chat (filesystem read access)
- Interactive code gth code (filesystem write access)

Читать далее

Миграция Левиафана: как удалось перевести базу в 40 ТБ данных на Postgres Pro

ср, 07/02/2025 - 17:27

Переезд крупных, высоконагруженных систем с одной СУБД на другую — всегда вызов, сравнимый с хирургической операцией на работающем сердце. Компания ОТР поделилась уникальным опытом миграции одной из таких систем с Oracle на отечественную Postgres Pro. Ирина Токарева и Сергей Кузнецов из ОТР рассказали о тернистом пути, противостоянии росту энтропии больших объёмов поступающих и изменяемых данных, достигнутых результатах.

Узнать тайны переезда

Рений в электронике: патентный анализ

ср, 07/02/2025 - 17:12

Рений — исключительно редкий элемент периодической системы Менделеева. Если построить пирамиду, по сторонам которой расположить элементы в порядке убывания их содержания в земной коре, то рений будет находиться в ее вершине. Кларковое содержание рения составляет семь на десять в минус восьмой степени процентов, что обусловливает необходимость большой степени концентрирования его при осуществлении технологических операций и выбор селективных материалов для этого. Тем не менее, этот редкий элемент все-таки используют во многих отраслях, в том числе при производстве электроники. Об этом и, разумеется, патентном аспекте мы сегодня и поговорим. 

Читать далее

Эти 7 книг сдвинули мои проекты с мертвой точки

ср, 07/02/2025 - 16:58

Я долго разбирался со своими двумя проектами: блогом и контент-командой, и наконец, почувствовал, что поставил их на ноги.

Что это значит? Это значит, что у меня есть прогнозируемый план развития проектов.

Я собрал книги, которые дали мне инсайты по управлению людьми, маркетингу, помогли разобраться с процессами. Сейчас расскажу про книжки, которые мне в этом помогли, расскажу, что я из них взял.

Читать далее

Чтобы завтра отчет был на столе: как автоматизация и TMS помогают прозрачно вести QA-процессы

ср, 07/02/2025 - 16:56

Как настроить автоматизацию так, что протокол собирался за одну минуту, а тесты шли без участия инженера? Можно ли организовать такую систему отчетности, чтобы она была полезна не только инженерам, но и представителям бизнеса? И главное: в какой TMS лучше управлять тестированием?

На QA-митапе опытные автоматизаторы из YADRO, Avito.Tech и Т-Банка, а также создатели тест-менеджмент системы TestY обсудили, как вести отчетность в тестировании без лишнего напряжения и какие инструменты должны стать «лучшими друзьями QA-инженера».

Читать далее

Загадка от Жака Фреско: как построить свой Rate Limiter и не утонуть в море компромиссов

ср, 07/02/2025 - 16:41

Построить Rate Limiter — легко. Сделать его быстрым, отказоустойчивым и работающим в нескольких дата-центрах — сложнее. Делюсь опытом реализации нашего облачного Rate Limiter в DDoS-Guard: принцип работы, анализ правил и реальные примеры из практики.

Читать далее

Значок верификации в Инсте* — участие в экстремизме

ср, 07/02/2025 - 16:36

Собственно не новость, что Фейсбук* и Инста* запрещены. Все знают, что экстремисты и прокляты, но вокруг этого запрета есть много странных мнений. Которые активно обострились за последний месяц из-за разгонов на счет запрета рекламы в запрещенных соцсетях с 1 сентября 2025 года.

Многие пишут, что покидают запрещенные соцсети, потому что не хотят попадать под уголовное преследование.

Давайте разберем, что реально происходит.

21 марта 2022 года Тверской районный суд Москвы вынес решение о том, что компания Meta Platforms — владелица Инстаграм, Фейсбук и WhatsApp, считается экстремистской организацией, а ее деятельность запрещена в России.
На основании этого проекты Фейсбук и Инстаграм тоже стали частью экстремизма и заблокированы на территории РФ.

При этом WhatsApp избежал блокировки, но:

Читать далее

Невыдуманные истории, когда владельцы бизнеса решили пренебречь информационной безопасностью

ср, 07/02/2025 - 16:18

Мечта собственника — сильная команда и высокая производительность. Но риски для компании мало кто осознает. Рассказываем, как предпринимателю понять мотивы сотрудников, есть ли угроза мошеннических схем, подделок документов, утечек информации и финансов.

Читать далее

Сетевой чат в Unity: Часть 1 — Основы и простой интерфейс

ср, 07/02/2025 - 16:14

Просто о сложном: первая часть из серии статей на тему создания сетевого чата в Unity с использованием Netcode for GameObjects. Для тех, кто начинает разбираться в сетевой логике.

Читать далее

Как переехать на OVN и не сломаться: пошаговый гайд

ср, 07/02/2025 - 16:07

Привет, Хабр! На связи вновь Кирилл Савин, архитектор SDN в Облаке Рег.ру. Недавно мы с командой взвесили все риски и приняли волевое решение — переехать на OVN. В процессе думали над архитектурой, решали возникающие вопросы и набивали шишки. Я решил поделиться нашим опытом и подходами.

В первой статье рассказали, как устроен OVN изнутри, рассмотрели особенности архитектуры. Теперь готовы перейти к практике! Во второй части опишу ручной подход для миграции облака с сетевым даунтаймом для перестроения сети, но без миграции, собственно, виртуальных машин. Для «переезда» я осознанно выбрал ручной подход — объясню, почему и что из этого получилось. Внутри — по шагам рассказываю о переезде и делюсь полезными конфигурациями, которые делают это возможным.

Читать далее

Лучшее сообщение об ошибке — это его отсутствие

ср, 07/02/2025 - 15:51

Привет! Меня зовут Игорь, я старший инженер по тестированию в Ozon Tech. Тестированием занимаюсь около 20 лет. До Ozon занимался проверкой качества ПО таких компаний как Smartbear, Evernote.  За это время в результате проб и ошибок, анализа обратной связи от пользователей, удалось найти решения, которые смогли уменьшить негатив от сообщений об ошибках. В этой статье я хочу привести несколько примеров, вызывающих наибольший негатив и как этого можно избежать. Это может быть полезно, если вы встретите подобные случаи в своих продуктах и позволит избежать их в новых разработках. 

Читать далее

Чистый чил: как сделать так, чтобы тебя не трогали по рабочим вопросам в отпуске

ср, 07/02/2025 - 15:48

Сезон отпусков в самом разгаре, но вместо долгожданного чила в гамаке ты получаешь в мессенджере: "Я знаю, что ты в отпуске, но можешь пожалуйста, посмотреть..."

В этой статье поделюсь принципами, которые позволяют спокойно уйти в отпуск - без стресса для себя и команды.

Читать далее

Продукты аналитики: как данные начинают приносить деньги бизнесу

ср, 07/02/2025 - 15:46

Сегодня для того, чтобы данные действительно работали на бизнес, недостаточно просто собрать и обработать их. Необходимо превратить их в понятные и удобные решения – своего рода аналитические продукты, которые приносят реальную пользу. Проще говоря, аналитический продукт (он же data product) – это автоматизированная цепочка действий над данными, результатом которой является полезная информация или рекомендация для решения конкретной бизнес-задачи. Появление таких продуктов стало возможным благодаря построению централизованной аналитической платформы с полной архитектурой данных от интеграции до представления. Иными словами, чтобы данные приносили пользу, они должны пройти путь от извлечения из источников до представления в понятной форме, охватывая этапы интеграции, обработки, представления и управления данными.

Наша «база» — единая аналитическая платформа, реализованная по принципам, применяемым в зрелых data-driven компаниях. В её основе – современный техстек, включающий стриминговую шину данных Apache Kafka на слое интеграции (Stage), высокопроизводительное хранилище ClickHouse на уровнях ODS/DWH/Data Mart, оркестратор пайплайнов Apache Airflow (с использованием dbt) для ETL/ELT и контроля качества данных, систему метаданных OpenMetadata для управления информацией о данных, BI-платформу Yandex DataLens для визуализации, а также собственный REST API-слой для интеграции с внешними системами. Такой подход обеспечивает масштабируемость и воспроизводимость: наша база данных поглощает до сотен миллионов записей в сутки и почти мгновенно выдаёт результаты аналитических запросов благодаря ClickHouse. Все инструменты связаны в единую архитектуру, где потоки событий из источников сразу попадают в Kafka, оттуда – в ClickHouse, после чего данные доступны для построения витрин, дашбордов, алертов и API-интеграций в реальном времени.

Читать далее

Не разработчик, а кулинар: почему приложение ― это салат, в который нельзя складывать испорченные ингредиенты

ср, 07/02/2025 - 15:44

На первый взгляд может показаться, что между разработкой и кулинарией нет ничего общего, но на самом деле сегодня создание приложений похоже на приготовление салата: берутся овощи, мясо, масла и приправы, все смешивается ― и получается блюдо. Если хоть один ингредиент окажется плохим, то весь салат будет испорчен.

Разработчики не все пишут сами, при подходе DevOps из общедоступных репозиториев могут браться готовые библиотеки, их соединяют, и в результате получается приложение (тот самый салат). Если хоть одна из библиотек окажется плохой или дописанный разработчиком код для объединения библиотек будет некачественным, то есть такой салат вы вряд ли захотите.

Мы как шеф-повара рекомендуем приправить DevOps опцией Sec. Эта специя поможет минимизировать стоимость и повысить скорость исправления ошибок. О DevSecOps-разработке мы и расскажем в статье. 

Читать далее

Сейчас на сайте

Сейчас на сайте 0 пользователей и 3 гостя.