___, или «Заголовок намеренно оставлен пустым»
Что делать, когда нужно описать опыт, для которого нет слов ни в одном языке? Третья статья цикла — о том, как в разговоре человека и LLM рождаются новые слова, почему они получили...
Search fresh public links, source activity, and post angles for Языковые Модели.
Fresh curated links around языковые модели are collected here so marketers can spot useful updates and turn timely ideas into posts faster.
Recent items include:
Recent curated links from global sources. Generate one free draft from any story, then use SocialBu to schedule and refine your content calendar.
Что делать, когда нужно описать опыт, для которого нет слов ни в одном языке? Третья статья цикла — о том, как в разговоре человека и LLM рождаются новые слова, почему они получили...
Источник: Компьютерра - Журнал о науке и технологиях Обновленный инструмент для обучения моделей позволяет адаптировать LLM под локальные задачи благодаря методу LoRA: он обучает...
В этой статье мы:сначала рассмотрим два базовых заблуждения относительно LLM “умеют что-то кроме текста” и “учатся от разговоров с пользователем”;потом после минимального погружени...
В последние годы в сфере изучения языков произошли два события, масштабы которых пока не оценены, но эти события уже запустили тектонический сдвиг, который скоро всех нас потрясёт....
Image gen by ChatGPT Images 2.0К такому выводу я пришел совместно с Сlaude, Grok, Qwen и ChatGPT, но рассказываю по порядку...А началось с того, что пришла шальная мысль: "Риторика...
Книги про большие языковые модели сегодня выходят с той же скоростью, с какой сами эти модели генерируют текст. Зайдите в любой крупный книжный магазин — не важно, в оффлайновый ил...
Рассмотрим альтернативу облачным моделям — локальный запуск LLM на своём компьютере.Этот подход даёт полный контроль над данными, но требует понимания ресурсов, форматов моделей и...
Почему понимание токенов, весов и словарей — ключ к продуктивной работе с AI-агентами. Первая глава цикла “Битва за контекст”. Читать далее
Источник: Компьютерра - Журнал о науке и технологиях Исследователи из MATS, Google DeepMind и Калифорнийского университета* изучили новый возможный сбой в обучении больших языковы...
Here are 5 small language models that hare one important trait: they all support structured tool calling in a compact, open-weight package.
Here are 5 small language models that hare one important trait: they all support structured tool calling in a compact, open-weight package.
ВведениеКакую бы мы ни использовали методику изучения иностранного языка, рано или поздно, вопрос упирается в расширение своего словарного запас.Самый примитивный метод для достиже...
Если пользоваться моделью, держите ее в роли клерка, критика или чернового редактора. Не отдавайте ей роль автора. Чем больше финального голоса вы передаете модели, тем сильнее тек...
Источник: Компьютерра - Журнал о науке и технологиях Компания MWS AI выпустила мультимодальную языковую модель Cotype Light 3, предназначенную для встраивания в ИИ-агентов. Модель...
Наша команда сравнила два открытых инструмента для проверки языковых моделей (LLM) на устойчивость к атакам: российский HiveTraceRed от HiveTrace/ITMO и международный garak от NVID...
О фундаментальных ограничениях больших языковых моделей одни говорят, что трансформеры, обученные предсказывать следующий токен (NTP), - тупиковый путь для создания интеллектуальны...
Если у вас есть неограниченный доступ к фронтир моделям (Calude, Codex и т.д.), то эта статья не для вас.Сегодня доступны отличные недорогие модели для кодинга и архитектуры. Напри...
Сегодня в технологической среде принято говорить об искусственном интеллекте так, будто он естественно продолжает и вскоре заменит человеческое мышление. Нейросети с миллиардами па...
Китайская компания DeepSeek представила флагманскую языковую модель V4 в двух версиях — Pro и Flash. Обе построены на архитектуре Mixture of Experts (MoE) и доступны бесплатно в ве...
Хотя большие языковые модели (LLM) демонстрируют выдающиеся способности к рассуждению, их потенциал для целенаправленного поиска в динамичных геопространственных средах остается ма...
Мы прогнали через o4-mini больше 300 вариантов промптов с разными режимами reasoning_effort и обнаружили, что чем «умнее» модель рассуждает, тем хуже она извлекает структуру: начин...
Источник: Компьютерра - Журнал о науке и технологиях DeepSeek выпустила новое поколение языковых моделей V4 — первое обновление линейки с начала 2025 года. В релиз вошли две верси...
Большие языковые модели требуют огромных объёмов памяти. Например, модель с 8 миллиардами параметров в формате FP16 занимает 24–27 ГБ памяти только для инференса (веса, кэш ключей-...
Большие языковые модели требуют огромных объёмов памяти. Например, модель с 8 миллиардами параметров в формате FP16 занимает 24–27 ГБ памяти только для инференса (веса, кэш ключей-...
Use SocialBu to discover ideas, generate post drafts, and schedule them across your social channels.