Habr.com

Ленты новостей Хабр
Все публикации подряд на Хабре
Обновлено: 1 час 27 мин. назад

ADSM: границы возможностей Моделей

ср, 09/10/2025 - 23:09

Мое понимание LLM с точки зрения пользователя очень простое: есть сетка с весами (обученные параметры), токенизатор и декодер (преобразователи текста во входные и выходные токены), и трансформер (слои внимания), который перерабатывает входные токены и шаг за шагом предсказывает новые.

Я пробовал разные Модели (GPT, Gemini, Deepseek, Grok) — все они, на мой взгляд, работают примерно одинаково. На один и тот же запрос они дают очень похожие, а иногда и идентичные ответы. Это ожидаемо, ведь все современные LLM построены на одной и той же архитектуре — трансформерах.

Это значит, что у всех реализаций есть общий шаблон поведения, отражающий их природу. В этой публикации я опишу наиболее важные, с моей точки зрения, характеристики Моделей, на которых я строю своё с ними общение.

Читать далее

[Перевод] Урок, который SpaceX извлекла из последнего полёта Starship: «Нам нужно герметизировать плитки»

ср, 09/10/2025 - 23:08

Это перевод англоязычной публикации на arstechnica.com от Стивена Кларка — репортёра Ars Technica, хотя сама статья фактически является интервью с Биллом Герстенмайером, вице-президентом SpaceX, в поле ответственности которого лежит весь производственный процесс и испытания перспективной транспортной системы Starship.

Читать далее

Ученые из МФТИ повысили безопасность нефтедобычи и судоходства в Арктике

ср, 09/10/2025 - 22:05

Коллектив российских ученых разработал новый способ численного моделирования ледовых торосов, айсбергов и стамухов в Арктике, который позволяет определить их структуру на основе ультразвукового сканирования толстых слоев льда. Их первоочередной задачей было описать криволинейные полости, заполненные воздухом и водой, чтобы получить проектных оценки ледовых нагрузок на инженерные сооружения. Работа была опубликована в российском научном журнале «Радиоэлектроника. Наносистемы. Информационные технологии». 

Новая работа ученых МФТИ, акцентирующая внимание на численном моделировании распространения волнового сигнала в торосах, демонстрирует инновационный подход к решению этой задачи. Используя сеточно-характеристический метод на структурированных и химерных расчетных сетках, исследователи проанализировали отклики от полостей, заполненных воздухом и водой. Их результаты дают возможность прогнозировать толщину ледяных образований и глубину их осадки.

Читать далее

Конфликтология в собеседованиях

ср, 09/10/2025 - 20:50

Привет, Хабр! Я идентифицирую себя IT-свахой, человеком, который постоянно мэчит кандидатов и работодателей. Их у меня много, я основатель рекрутингового агентства и конференции ProIT Fest. И я вижу огромное кол-во конфликтов на собеседованиях, которых не замечают другие. А еще я клинический психолог, поэтому сегодня будет небольшой оттенок именно из психологии. Начнем с базы. Когда происходит конфликт? На такой простой вопрос мне мало кто отвечал правильно.

Читать далее

Как мир вернулся в «классический веб» — взлет и падение эпохи мобильных приложений

ср, 09/10/2025 - 20:47

Помните, одно время тематические площадки заполонили статьи вида: «Я устал от [плохих] приложений для изучения английского, поэтому сделал своё» или «Я устал от [неправильных] трекеров продуктивности, поэтому создал собственный»? В реалиях современных аппсторов заголовок можно сократить до: «Я устал».

Статистика говорит, что app fatigue is real. А мы в Beeline Cloud решили посмотреть, как менялось отношение к приложениям — от «эры пост-ПК» до настоящего времени.

Читать далее

Автоматизация бизнеса с ИИ: где его стоит применять, а где — нет

ср, 09/10/2025 - 20:44

Искусственный интеллект (ИИ) призван помогать человеку выполнять самые разные задачи, особенно рутинные и однотипные. А в бизнесе таких полно, значит, автоматизировать рабочие операции и делегировать их ИИ сам Бог велел. На рынке регулярно появляются новые решения как специализированные, так и универсальные. Казалось бы, здорово — экономия времени и ресурсов, повышение качества работы. Но ИИ вовсе не так умен, как многие могут подумать. В этой статье я предлагаю обсудить, в каких сферах от «текущего ИИ» есть польза, а в каких — нет, а также поговорить о тех деформациях и проблемах, которые создает новая технология для бизнеса. Материал — попытка объективно взглянуть на нейросети и предназначен больше для руководителей, нежели технических специалистов.

Не тот, кем кажется

Сам вопрос «Где уместно применять ИИ?» возникает потому, что люди ожидают от искусственного интеллекта именно интеллекта. Люди его очеловечивают, наделяют антропоморфными качествами. На самом же деле искусственный интеллект не умеет рассуждать, самостоятельно в чем-то разбираться, проявлять инициативу. Современный генеративный ИИ лишь предугадывает наиболее вероятные следующие события (слово, ноту, пиксель), а это — чисто математический процесс.

Я был удивлен, но даже люди, обучающиеся цифровизации, нередко считают ИИ самостоятельным. Например, некоторые предлагают поручить GenAI управление производственным станком в надежде, что машина сама разберется в чертежах. Нет, я не спорю, не исключено, что антропоморфных роботов люди будут считать полноценными членами семьи — подобное давно можно найти в художественной литературе и кинематографе. Возможно, это и произойдет, но точно не в ближайший год-два. Пока же у генеративного ИИ — множество ограничений. Но упаковать его в продукт и использовать во благо бизнеса, впрочем, можно.

Читать далее

BotHub для Google Sheets: как создать генератор контента для интернет-магазина прямо в таблице

ср, 09/10/2025 - 20:06

Наша компания BotHub представила новое приложение для электронных таблиц Google Sheets, которое позволяет запускать нейросети из ячеек электронных таблиц. Да‑да, без необходимости переключаться между программами или теряться во вкладках браузера! Просто берёте нужные данные — и... всё остальное делает ИИ. Красота, правда?

Я думаю (и, признаюсь, надеюсь), что статья перед вами — это что‑то вроде микса всеядного гайда и вдохновляющего мануала. Для всех, кто хоть раз открывал таблицу (а таких немало), это должно стать открытием.

Приготовьтесь к диалогу с ячейками — самому странному разговору в вашей жизни.

Читать далее

Карьера после стажировки: кейсы «выпускников» Service Desk

ср, 09/10/2025 - 20:06

Служба техподдержки помогает не только пользователям, внешним и внутренним. Для стажера работа саппортом — отличный способ получить необходимую техническую базу, чтобы потом находить применение полученным знаниям во многих областях и командах компании. Можно остаться в поддержке и вырасти в специалиста по ключевой инфраструктуре «Лаборатории Касперского», можно стать тестировщиком, экспертом по инфобезу или девопсом.

В этом посте три специалиста «Лаборатории Касперского» рассказывают, как начинали со стажировки в Service Desk, объясняют, какие навыки приобрели, и делятся советами — как на старте получить максимум поддержки в своем индивидуальном IT-пути. 

Читать далее

Автоматизируем подготовку промтов для GPT: Python-функция для детального описания DataFrame

ср, 09/10/2025 - 20:05

Привет, меня зовут Виталий. Автор телеграмм канала «Детектив данных» про смену профессии и мой вкат в «аналитику» после 30 лет. И да, я уже наверное года полтора использую помощь нейросети при написании кода на Питоне.

Следствие установило, что для получения качественного ответа часто приходится потратить довольно много времени на описание таблицы, где какой тип данных, примеры, формат, количество nan значений, диапазон дат и прочие нюансы.

Будто при допросе вместо описания преступника, следователь внимательно изучает все родинки у допрашиваемого лица. И у адвоката.

В качестве жертвы у нас рабочее время, которое можно потратить на описание задачи.

В какой то момент я подумал, а почему бы не сделать универсальную функцию которая будет собирать эту информацию за меня, и сразу писать какой нибудь универсальный промт, потому что, до кучи мне и его лень писать.

В общем вашему вниманию предлагаю эту функцию. Всё что нужно, это вставить код в ячейку, и в следующей команде указать ваш датафрейм. Принт выведет вам готовый промт с описанием вашей таблицы, расскажет тип данных каждого столбца, покажет примеры значений, диапазоны и количество пропусков, а заодно проверит датафрейм на дубликаты.

Смотрим функцию, сохраняем

Почему посольство просит скинуть фото паспорта в WhatsApp — и что с этим не так

ср, 09/10/2025 - 19:59

Казалось бы, какое отношение беспорядки в Непале могут иметь к информационной безопасности в России? Примерно так я и думал, пока мне прямо с утра в глаза не бросился выделенный брутальным красным цветом пост в официальном Telegram‑канале МИД России, призывающий сограждан передавать свои персональные данные «для учета» через WhatsApp.

Читать далее

5 ошибок начинающих IT рекрутеров

ср, 09/10/2025 - 19:47

В найме инженеров резюме — это не источник истины, а гипотеза, которую нужно проверять. В IT часто недоописывают роли и задачи, а порой аккуратно «накручивают» грейд и достижения: формулировка «делал приложение банка» легко скрывает один экран или один микросервис. В тексте разбираю пять типичных ловушек начинающих рекрутеров: доверие резюме без верификации, отсутствие бенчмарка под роль, размытые вопросы, путаницу уровней и игнор контекста командной работы — с практиками, как быстро отделять маркетинг от компетенций и не тратить время нанимающего менеджера впустую.

Читать далее

Мониторинг SSL-сертификатов в oVirt Engine: как мы научились спать спокойно благодаря Go и Prometheus

ср, 09/10/2025 - 19:41

Как избежать простоев и сбоев из-за просроченных SSL-сертификатов? Мы в HOSTKEY разработали простой, но надёжный инструмент на Go для oVirt Engine, интегрированный с Prometheus и Grafana. Теперь система сама предупреждает о проблемах — задолго до их возникновения.

Читать далее

Как узнать номер в Телеграм, если он скрыт: поиск данных о человеке по Telegram ID

ср, 09/10/2025 - 19:31

В этом материале мы рассмотрим рабочие способы идентификации  пользователя Telegram по его ID, когда номер телефона скрыт в настройках приватности. Вы узнаете, почему в некоторых случаях номер не  отображается, а также познакомитесь с альтернативными методами  установления личности владельца аккаунта.

Дисклеймер: Представленные в статье способы предназначены только для ознакомления и  не должны применяться в незаконных целях или для вторжения в частную  жизнь других людей.

Читать далее

[Перевод] DOOMQL: DOOM-подобный многопользовательский шутер на чистом SQL

ср, 09/10/2025 - 19:28

Недавно я набрёл на шедевр Патрика — клон DOOM, основанный на DuckDB-WASM и работающий в браузере. Прочитав о нём, я решил  довести  эту великолепную идею до логического завершения: написать многопользовательский DOOM-подобный шутер целиком на SQL. При этом всю тяжёлую работу хотел сделать через базу данных CedarDB. Отлучившись с работы в месячный отпуск по уходу за ребёнком (бессонных ночей хватало), я попытался сделать именно это.

Вот вам тизер DOOMQL:

Читать далее

Страшные ATS-фильтры и как их пройти: мифы и реальность

ср, 09/10/2025 - 19:26

Привет, Хабр!

В последнее время вокруг ATS столько шума, что иногда кажется, будто поиск работы – это игра с секретными уровнями. То какие-то ATS автоматически отказывает кандидатам и нужно переписывать резюме под каждую вакансию, то нужно использовать сервисы, которые помогают пройти фильтры.

Чаще всего эти страшилки исходят от людей, которые к реальному рекрутингу отношения не имеют, но очень любят учить «как правильно». Я решила копнуть глубже: откуда все эти слухи, где правда, а где миф. Потому что за годы работы я такого не встречала, а знакомые рекрутеры из международных компаний только разводят руками.

Читать далее

Августовский дайджест — AI-агенты + урожай апдейтов в Kubernetes, S3 и базах данных

ср, 09/10/2025 - 19:05

Дорогой дневник, мне не описать всю боль и унижение, когда лето закончилось…   

И не описать всю радость от того, что каждый месяц выходят новые релизы в Клауде. 

Перелистываем страничку и пишем для вас краткий обзор впечатлений августа — новые сервисы, апдейты, прямые эфиры и многое другое. 

В этот дневник точно можно заглянуть. Правда-правда. Мы никому не расскажем ↓

Читать далее

О «залипании» процесса checkpoint и archive_timeout в Postgres

ср, 09/10/2025 - 18:29

Добрый день, коллеги!

Недавно мы столкнулись со следующей проблемой при тестировании СУБД PostgresPro под высокой нагрузкой: процесс представлял собой массированную многопоточную заливку данных на протяжении многих часов,а данных было около 20 ТБ, потоков — 75.

В процессе загрузки наблюдалось следующее явление: через некоторое время процесс checkpointer переставал делать контрольные точки в зависимости от других параметров БД либо сразу, либо через 2-3 часа.

Читать далее

DataHub: Как интеллектуальный хаб данных меняет правила игры на рынке кредитования и займов

ср, 09/10/2025 - 18:28

Финансовый рынок цифровизируется с невероятной скоростью: клиенты ждут персональных предложений за пару кликов, банки и МФО ищут качественных заемщиков, а партнеры — удобные и технологичные инструменты для монетизации трафика. На стыке этих интересов возникает потребность в принципиально новых решениях. Старые методы лидогенерации и скоринга уже не справляются: они либо не дают нужной глубины анализа.

Именно этот разрыв между потребностями рынка и существующими возможностями закрывает платформа DataHub. Это не просто очередной сервис, а целая экосистема, которая действует в интересах всех сторон: кредитора, партнера и, что самое важное, конечного клиента. Рассказываем, как мы создаем продукт, который подойдет для всех.

Читать далее

День, когда высох Ниагарский водопад

ср, 09/10/2025 - 18:20

До строительства электростанций на реке Ниагара поток воды, проходящий через водопад, более чем вдвое превышал современный. Тем не менее, в ночь с 28 на 29 марта 1848 г. он практически иссяк. В то время, благодаря каналам и железным дорогам, население местности и число туристов уже были велики, так что осталось много подробных свидетельств о случившемся. День начался с того, что людей разбудила непривычная тишина.

Читать далее

WireMock для QA: от ручных проверок до автотестов

ср, 09/10/2025 - 18:16

Вам часто приходится тестировать API, когда бэкенд-сервис ещё не готов? В этой статье мы рассмотрим WireMock — удобный инструмент для создания стабов и моков. Вы узнаете, как легко эмулировать работу API, запускать его в standalone-режиме, а также использовать для ручного и автоматизированного тестирования.

Читать далее

Сейчас на сайте

Сейчас на сайте 0 пользователей и 0 гостей.