llama.cpp теперь умеет работать с речью
Сегодня (12 апреля) в проект llama.cpp залили PR, который добавляет новый функционал - работа с audio.Речь идёт о поддержке моделей Gemma4, которые умеют распознавать речь:https://...
Search fresh public links, source activity, and post angles for Распознавание Речи.
Fresh curated links around распознавание речи are collected here so marketers can spot useful updates and turn timely ideas into posts faster.
Recent items include:
Recent curated links from global sources. Generate one free draft from any story, then use SocialBu to schedule and refine your content calendar.
Сегодня (12 апреля) в проект llama.cpp залили PR, который добавляет новый функционал - работа с audio.Речь идёт о поддержке моделей Gemma4, которые умеют распознавать речь:https://...
Источник: Компьютерра - Журнал о науке и технологиях Анализ кода мессенджера MAX (VK) показал наличие нейросетевого модуля распознавания ключевых слов, работающего во время голосо...
Не писал на Spring уже лет 8 и решил по фану написать мини пет проект с api и распознаванием речи. Звучит круто, лет 8-10 назад это заняло бы … вечность, тогда и llm, достаточно к...
Стартап Thinking Machines Lab, учреждённый в прошлом году бывшим техническим директором OpenAI Мирой Мурати (Mira Murati), рассказал о своём новом проекте. Речь идёт о моделях взаи...
Google выпустила новое программное обеспечение, способное конвертировать устную речь в текстовый формат без необходимости подключения к интернету и оформления подписок. Новое прило...
Xiaomi представила две модели искусственного интеллекта, предназначенные для работы с голосом. MiMo-V2.5-TTS позволяет преобразовывать текст в речь, предлагая широкие возможности н...
Написал полностью офлайновый голосовой ввод на русском для Android. Никаких серверов, подписок и привязок к аккаунтам. За распознавание отвечает открытая нейросеть GigaAM v3 от Сбе...
Google без громких анонсов выпустила приложение, способное в автономном режиме, то есть без подключения к интернету, преобразовывать речь в текст. Приложение получило название Goog...
Помните, как мы смотрели фантастику и завидовали Тони Старку с его Джарвисом? Казалось, еще чуть-чуть, и машины заговорят с нами голосами британских дворецких. Но реальность долго...
Xiaomi объявила о выходе открытой модели искусственного интеллекта OmniVoice, предназначенной для преобразования текста в речь — помимо речевого синтеза на нескольких сотнях языков...
До настоящего разговора с животными ещё далеко, но технология уже меняет наше понимание их коммуникации. ИИ уже распознаёт смысл в звуках животных. Алгоритмы находят повторяющиеся...
По мере погружения в ИИ и вайб‑кодинг, я столкнулся с одним неудобным моментом — отсутствием возможности диктовать на русском языке в некоторых программах. И если OpenAI в своем пр...
Источник: Компьютерра - Журнал о науке и технологиях Релиз ориентирован на комплексное ускорение подготовки данных и расширение аналитических возможностей при работе с тремя типам...
Привет, Хабр! Меня зовут Коля, я разработчик машинного обучения в команде речевых технологий Контура. Мы разрабатываем собственную систему распознавания речи (ASR), которая ежеднев...
Нейросеть Apple Intelligence в iOS 27 будет сама собирать быстрые команды по описанию голосом. Разбираем, как это работает и когда ждать.
В России уже используют свыше 3 тысяч «умных» аудиобейджей для оценки качества обслуживания граждан. За всё время работы системы искусственный интеллект обработал около 600 тысяч ч...
Источник: Компьютерра - Журнал о науке и технологиях Новый способ поиска адреса по базе разбивает адрес на элементы и уточняет только недостающие данные, без необходимости полного...
Use SocialBu to discover ideas, generate post drafts, and schedule them across your social channels.