Latest updates for Большие Языковые Модели

Fresh curated links around большие языковые модели are collected here so marketers can spot useful updates and turn timely ideas into posts faster.

Recent items include:

  • Большие языковые модели на практике – международный бестселлер теперь на русском языке
  • ИИ показал прогресс в изучении редких и малоизвестных языков
  • Новый NLU Suite от BSS: как создать кастомную языковую модель с минимальными затратами

Post angles to try

Share the most useful takeaway for your audience.
Turn one article into a quick practical checklist.
Ask your audience how this shift affects their work.
Turn angles into scheduled posts

Fresh articles and ideas

Recent curated links from global sources. Generate one free draft from any story, then use SocialBu to schedule and refine your content calendar.

habr.com /1 month ago

Большие языковые модели на практике – международный бестселлер теперь на русском языке

Книги про большие языковые модели сегодня выходят с той же скоростью, с какой сами эти модели генерируют текст. Зайдите в любой крупный книжный магазин — не важно, в оффлайновый ил...

Read source
3dnews.ru /1 month ago

ИИ показал прогресс в изучении редких и малоизвестных языков

Большие языковые модели искусственного интеллекта стали активно сокращать языковой разрыв по всему миру — самые передовые добились существенных успехов в работе с редкими языками,...

Read source
computerra.ru /1 month ago

Новый NLU Suite от BSS: как создать кастомную языковую модель с минимальными затратами

Источник: Компьютерра - Журнал о науке и технологиях Обновленный инструмент для обучения моделей позволяет адаптировать LLM под локальные задачи благодаря методу LoRA: он обучает...

Read source
habr.com /2 weeks ago

[Перевод] Квантизация больших языковых моделей: FP32, BF16, INT8, NF4 и QLoRA

Большие языковые модели требуют огромных объёмов памяти. Например, модель с 8 миллиардами параметров в формате FP16 занимает 24–27 ГБ памяти только для инференса (веса, кэш ключей-...

Read source
habr.com /2 weeks ago

[Перевод] Квантизация больших языковых моделей: FP32, BF16, INT8, NF4 и QLoRA

Большие языковые модели требуют огромных объёмов памяти. Например, модель с 8 миллиардами параметров в формате FP16 занимает 24–27 ГБ памяти только для инференса (веса, кэш ключей-...

Read source
habr.com /2 weeks ago

[Перевод] Квантизация больших языковых моделей: FP32, BF16, INT8, NF4 и QLoRA

Большие языковые модели требуют огромных объёмов памяти. Например, модель с 8 миллиардами параметров в формате FP16 занимает 24–27 ГБ памяти только для инференса (веса, кэш ключей-...

Read source
habr.com /4 weeks ago

«Опенсорс + ИИ = Китай»: как открытые языковые модели помогли стране ворваться в гонку

Мы в Beeline Cloud продолжаем рассказывать про опенсорс-разработку в Китае. В первой статье вспомнили, как привезли в страну Linux, во второй обсудили, как менялась китайская экоси...

Read source
habr.com /1 month ago

[Перевод] EVGeoQA: Оценка LLM в динамическом, многоцелевом геопространственном поиске

Хотя большие языковые модели (LLM) демонстрируют выдающиеся способности к рассуждению, их потенциал для целенаправленного поиска в динамичных геопространственных средах остается ма...

Read source
habr.com /3 weeks ago

Большие модели, маленькие токены. ЛЛМ - битва за контекст (ч.1)

Почему понимание токенов, весов и словарей — ключ к продуктивной работе с AI-агентами. Первая глава цикла “Битва за контекст”. Читать далее

Read source
computerra.ru /1 month ago

DeepSeek представила V4 с контекстом 1 млн токенов и открытым кодом

Источник: Компьютерра - Журнал о науке и технологиях DeepSeek выпустила новое поколение языковых моделей V4 — первое обновление линейки с начала 2025 года. В релиз вошли две верси...

Read source
habr.com /1 month ago

[Перевод] Пять мыслей о возможностях и ограничениях LLM

О фундаментальных ограничениях больших языковых моделей одни говорят, что трансформеры, обученные предсказывать следующий токен (NTP), - тупиковый путь для создания интеллектуальны...

Read source
3dnews.ru /1 month ago

Google выпустила семейство открытых моделей Gemma 4 с поддержкой 140 языков и лицензией Apache 2.0

Компания Google представила четыре открытые модели Gemma 4, созданные на основе технологий модели Gemini 3, выпущенной в конце прошлого года. Модели различаются количеством парамет...

Read source
habr.com /1 month ago

llama.cpp теперь умеет работать с речью

Сегодня (12 апреля) в проект llama.cpp залили PR, который добавляет новый функционал - работа с audio.Речь идёт о поддержке моделей Gemma4, которые умеют распознавать речь:https://...

Read source
computerra.ru /3 weeks ago

Языковые модели могут скрывать способности во время обучения

Источник: Компьютерра - Журнал о науке и технологиях Исследователи из MATS, Google DeepMind и Калифорнийского университета* изучили новый возможный сбой в обучении больших языковы...

Read source
iguides.ru /1 month ago

Нейросеть DeepSeek выпустила флагманскую модель V4 — бесплатно для всех

Китайская компания DeepSeek представила флагманскую языковую модель V4 в двух версиях — Pro и Flash. Обе построены на архитектуре Mixture of Experts (MoE) и доступны бесплатно в ве...

Read source
computerra.ru /1 month ago

Российская библиотека DeepPavlov получила новые инструменты для работы с ИИ

Источник: Компьютерра - Журнал о науке и технологиях Ученые из МФТИ, MWS AI, AIRI, ИТМО и AI Talent Hub представили обновление для открытой библиотеки DeepPavlov, предназначенной...

Read source
habr.com /3 weeks ago

Скрытая цена LLM: как KV-cache увеличивает стоимость инференса и как эту проблему решает Google TurboQuant

При инференсе LLM общее потребление памяти определяется не только размером самой модели, но и промежуточными данными, накапливаемыми в процессе ее работы. С ростом контекста объем...

Read source
habr.com /1 month ago

Ваш любимый ИИ не умеет считать. Что ещё скрывает текстовая модель?

В этой статье мы:сначала рассмотрим два базовых заблуждения относительно LLM “умеют что-то кроме текста” и “учатся от разговоров с пользователем”;потом после минимального погружени...

Read source
habr.com /1 week ago

Прогнал семь LLM через свой русский спортивный бенчмарк. Базовой моделью всё равно оставляю Gemma 4 31B

Прогнали семь LLM через свой русский спортивный бенчмарк. Топовые модели closed-source выигрывают 1.5-1.7 балла. Базовой моделью всё равно остаётся Gemma 4 31B — рассказываю почему...

Read source
habr.com /1 week ago

Облачная LLM на 16 ГБ VRAM — часть 2: LangGraph Server, LangSmith и SDK

Друзья, привет! Возвращаюсь с продолжением.В первой части мы разобрались, как поднять локальную LLM и пробросить к ней внешний доступ. Но до настоящей интеграции в продукт так и не...

Read source
computerra.ru /1 month ago

В России запущена новая языковая модель Grom как альтернатива GigaChat

Источник: Компьютерра - Журнал о науке и технологиях Платформа GPTunneL запустила собственную языковую модель Grom, работающей на российской инфраструктуре. В настоящее время серв...

Read source
habr.com /3 weeks ago

HiveTraceRed vs garak: тестируем безопасность языковых моделей на русском и английском

Наша команда сравнила два открытых инструмента для проверки языковых моделей (LLM) на устойчивость к атакам: российский HiveTraceRed от HiveTrace/ITMO и международный garak от NVID...

Read source
habr.com /1 month ago

LLM как декодер в ASR: опыт адаптации SOTA архитектуры для спонтанной русскоязычной речи

Привет, Хабр! Меня зовут Коля, я разработчик машинного обучения в команде речевых технологий Контура. Мы разрабатываем собственную систему распознавания речи (ASR), которая ежеднев...

Read source
habr.com /4 days ago

Революция в изучении языков

В последние годы в сфере изучения языков произошли два события, масштабы которых пока не оценены, но эти события уже запустили тектонический сдвиг, который скоро всех нас потрясёт....

Read source

Turn fresh research into a full content calendar

Use SocialBu to discover ideas, generate post drafts, and schedule them across your social channels.

Sources covering Большие Языковые Модели

3dnews.ru

Recent coverage from public sources
Public source

habr.com

Recent coverage from public sources
Public source

computerra.ru

Recent coverage from public sources
Public source

iguides.ru

Recent coverage from public sources
Public source