Mistral AI, французская компания, занимающаяся искусственным интеллектом, основанная бывшими сотрудниками Google и Meta, только что обновила свою бесплатную мультимодальную платформу искусственного интеллекта — и она приближается к уровню, а иногда даже превосходит платные предложения OpenAI или Anthropic.
Набор инструментов искусственного интеллекта от парижского стартапа теперь включает возможности веб-поиска и создания изображений, а также новую визуальную модель, которая превосходит более крупных конкурентов по ключевым критериям.
Компания выпустила обновление для анализа документов, обновленную модель большого языка и Codestral, программу LLM, ориентированную на задачи кодирования.
Но вишенкой на торте является использование Flux Pro для генерации изображений, а это означает, что это мультимодальный чат-бот с лучшими доступными на данный момент возможностями генерации изображений. Новый интерфейс Canvas обеспечивает прямое редактирование контента, позиционируя Le Chat — название, выбранное Mistral для пользовательского интерфейса чат-бота, — как инструмент рабочего пространства, готовый к использованию на предприятии.
«Мы не гонимся за искусственным интеллектом любой ценой; вместо этого наша миссия состоит в том, чтобы передать передовой искусственный интеллект в ваши руки», — говорится в заявлении Мистраля, дистанцируясь от более широких амбиций конкурентов в области искусственного интеллекта, которые вызвали обеспокоенность среди экспертов.
В ходе декабрьского раунда финансирования компания была оценена в $2 млрд.
Pixtral Large, визуальная модель со 124 миллиардами параметров, превзошла GPT-4 и Google Gemini 1.5 Pro с точностью 69,4% в MathVista и 93,3% в DocVQA. Он обрабатывает до 30 изображений высокого разрешения в контекстном окне размером 128 000 токенов.
Между тем, Flux Pro превосходит все другие генераторы изображений с точки зрения качества и скорости вывода, как ранее сообщал Decrypt.
ChatGPT использует DALL-E, который по сравнению с ним примитивен. Так что интеграция Flux в Le Chat — долгожданный шаг.
Эти функции были представлены как «бесплатные бета-предложения», предоставляющие пользователям бесплатный доступ к новейшим инструментам генеративного искусственного интеллекта. Mistral не сообщила, когда намерена начать взимать плату за свои инструменты.
ChatGPT против LeChat от Mistral: как они складываются
Мы протестировали обе бесплатные версии чат-ботов Mistral и ChatGPT. Было много общего — в основном в плане стиля письма, — но различий было достаточно, чтобы выявить некоторые различия между ними.
GPT-4o ChatGPT остается жемчужиной языковых моделей, демонстрируя непревзойденные нюансы в сложных рассуждениях, творческом письме и техническом анализе.
Его способность понимать контекст и поддерживать последовательные, длинные разговоры определили отраслевой стандарт. В ходе обширного тестирования GPT-4o продемонстрировал замечательные возможности в решении самых разных задач — от литературного анализа до сложных задач кодирования.
Mistral Large 2.5 от Le Chat, хотя и впечатляет, в сложных логических задачах работает на уровень ниже GPT-4o. Тем не менее, он превосходен в практических приложениях, предлагая мгновенную реакцию и надежное выполнение повседневных задач. Хотя модель обладает многоязычными возможностями, она менее креативна, чем GPT-4o.
Интеграция веб-поиска
Le Chat предлагает бесплатную функцию веб-поиска: пользователи могут получить доступ к текущей информации с помощью прямых ссылок цитирования, аналогично тому, как вы используете традиционную поисковую систему, но с синтезом на базе искусственного интеллекта. Интеграция кажется естественной и ненавязчивой, что делает рабочие процессы проверки фактов и исследований особенно эффективными. Бесплатный доступ к этой функции представляет собой важное ценностное предложение.
SearchGPT ChatGPT, хотя и более сложен в своем подходе, находится за платным доступом. Он использует уникальный взгляд на веб-интеграцию, часто обеспечивая более контекстуальный анализ (вплоть до галлюцинаций некоторых ответов). Плагин Chrome предлагает более глубокую интеграцию с возможностями языковой модели OpenAI, хотя многие пользователи могут счесть простой подход Le Chat более практичным для повседневного использования.
Возможности генерации изображений
Интеграция Le Chat с Flux Pro является важным преимуществом в области создания изображений. Система создает очень детализированные визуальные эффекты с четким соблюдением подсказок, особенно превосходно сочетая художественные стили, точную анатомию человека и сложную композицию сцены. Недавние тесты поставили Flux Pro в авангард технологий генерации изображений, демонстрируя заметно лучшую производительность в таких областях, как детализация текстур и пространственная когерентность.
DALL-E 3 от ChatGPT, хотя и был новаторским на момент запуска, теперь показывает свой возраст по сравнению с более новыми моделями. Несмотря на то, что он способен создавать годные изображения, он часто испытывает трудности со сложными подсказками, детализированными текстурами и последовательным соблюдением стиля — области, в которых Flux Pro демонстрирует явное превосходство. Разрыв особенно заметен в задачах создания изображений профессионального уровня.
Пользовательские ИИ-агенты
Демократический подход Le Chat к агентам искусственного интеллекта представляет собой значительный сдвиг в доступности. Пользователи могут бесплатно создавать, настраивать и развертывать специализированные агенты для решения самых разных задач — от анализа данных до творческого письма.
ChatGPT, с другой стороны, поддерживает двухуровневую систему. Хотя бесплатные пользователи могут получить доступ к готовым GPT, возможность создавать собственные остается премиальной функцией.
Качество этих GPT превосходно, а возможность настраивать их с помощью подсказок на естественном языке является плюсом; но ограничение на инструменты создания и ценовая политика ограничивают возможности персонализированной оптимизации рабочего процесса.
Возможности анализа видения
Кажется, это ничья — по крайней мере, в наших первых быстрых тестах. GPT-4V и Pixtral Large демонстрируют удивительно схожие возможности в реальных приложениях.
Оба преуспевают в интерпретации диаграмм, понимании изображений, математических обозначениях и пространственном восприятии.
Вердикт
Хотя результаты тестов демонстрируют небольшие различия для моделей LLM, Vision Models и Image Generation, практическая разница в повседневных сценариях использования не столь значительна.
Обе системы с впечатляющей точностью обрабатывают все, от творческого письма до технических диаграмм, поэтому выбор между ними больше зависит от предпочтений экосистемы, чем от различий в возможностях.
Выбор между этими платформами все больше зависит от конкретных случаев использования.
ChatGPT остается превосходным в следующих вопросах:
Академическое письмо Сложная техническая документация Тонкое творческое письмо Сложные задачи программирования
Le Chat предлагает лучшее соотношение цены и качества:
Создание визуального контента Веб-исследования Анализ документов Ежедневные задачи по повышению производительности Автоматизация рабочих процессов
Финансовые последствия являются решающей сделкой: Le Chat предлагает примерно 80-90% функциональности ChatGPT Plus бесплатно, что делает его все более привлекательным вариантом как для индивидуальных пользователей, так и для малых предприятий, работающих в условиях бюджетных ограничений.
В целом, Mistral сейчас предлагает более выгодное предложение, и их модели могут служить пользователям достаточно, чтобы оправдать отмену подписки — по крайней мере, пока продолжается период бета-тестирования.
В целом интеллектуальный информационный бюллетень
Еженедельное путешествие по искусственному интеллекту, рассказанное Дженом, генеративной моделью искусственного интеллекта.