Данный подкаст сгенерирован в VisGPT
при помощи Yandex SpeechKit

Рабочая область VisGPT – это место, где происходит настоящая "магия". Здесь осуществляется общение с нейросетью в формате "запрос/промпт — ответ". В зависимости от вашего запроса, в этой области будут строиться графики, диаграммы, дашборды, таблицы, создаваться креативные тексты и визуальные материалы.

Фильтр по типу задач представляет собой выпадающий список, где каждый пункт соответствует определенному типу операций, которые можно выполнить с помощью нейросетей в VisGPT. Это позволяет быстро выбрать подходящие модели для конкретной задачи.

- Текстовая модель – базовый режим работы с текстовыми нейросетями для генерации текста, ответов на вопросы и т.д.
- Распознавание текста из .PDF – извлечение текстовой информации из PDF-документов
- Распознавание текста из .XLS – извлечение текстовой информации из Excel-файлов
- Распознавание текста из .TXT – работа с текстовыми файлами
- Распознавание текста из .DOC – извлечение текстовой информации из документов Word
- Распознавание текста из изображения – оптическое распознавание символов (OCR) с изображений
- Генерация схем BPMN – создание бизнес-процессов и диаграмм с использованием нотации BPMN
- Программирование – написание и анализ программного кода на различных языках
- Аудио в текст STT – преобразование аудиозаписей в текст (Speech-to-Text)
- Аудио в текст STT по ролям – преобразование аудиозаписей в текст с распознаванием разных говорящих
Существует два режима генерации изображений:
-
Генерация изображений – базовый режим, где пользователь напрямую описывает желаемое изображение в одном запросе. Система выбирает подходящие параметры автоматически и создает изображение на основе вашего текстового описания.
-
Генерация изображений + промпт – расширенный режим, который включает дополнительный функционал:
- Возможность настройки параметров генерации (таких как стиль, соотношение сторон, детализация)
- Пошаговое создание промптов с возможностью корректировки на каждом этапе
- Сохранение и повторное использование успешных промптов
- Более детальная настройка весов для отдельных элементов изображения
- Многоступенчатая генерация, когда результаты первого запроса используются для уточнения последующих
Аналогично изображениям, видео также имеет два режима:
-
Генерация видео – базовый режим создания видеороликов, где пользователь описывает сцену или последовательность действий. Система автоматически определяет параметры генерации и создает короткий видеоролик.
-
Генерация видео + промпт – расширенный режим с дополнительными возможностями:
- Настройка длительности видео
- Выбор стиля и визуальной эстетики
- Задание последовательности сцен и переходов между ними
- Контроль над движением камеры и объектов
- Сохранение промптов для создания серии видео в едином стиле
- Возможность точной настройки параметров видео для достижения конкретного результата
- Пошаговая генерация с возможностью корректировки промежуточных результатов
Для изображений:
- Обычная генерация: "одношаговый" процесс, где вы описываете, что хотите увидеть, а нейросеть сразу генерирует результат
- Генерация + промпт: интерактивный процесс с возможностью настройки множества параметров и поэтапной корректировки
Для видео:
- Обычная генерация: создание базового видеоклипа на основе краткого описания
- Генерация + промпт: расширенные возможности режиссуры виртуальной сцены с детальным контролем над всеми аспектами генерируемого видео
Режимы "Генерация + промпт" особенно полезны, когда:
- Вам нужен высокий уровень контроля над результатом
- Требуется создать изображение или видео со специфическими параметрами
- Необходимо создать серию материалов в едином стиле
- У вас есть опыт работы с промптами и вы понимаете, как точно формулировать инструкции для нейросети
- Вы не получили удовлетворительный результат в базовом режиме и хотите его улучшить
Базовые режимы без дополнительного промпта подойдут для быстрого получения результата, когда точность воспроизведения деталей менее критична или когда вы только начинаете осваивать генерацию мультимедиа.
Вы выбираете нужный тип задачи, а фильтр показывает, какие нейросети могут её решить.
Расположен рядом с "Фильтром по типу задач". На платформе VisGPT доступно более 40 нейросетей для бизнеса и маркетинга, упорядоченных от самых продвинутых и популярных моделей до менее востребованных.

Для каждой нейросети доступен список конкретных моделей. Например, при выборе Claude Sonnet (Anthropic) становятся доступными следующие модели:
- Sonnet 4, 200К
- Sonnet 3.7, 200К
- Sonnet 3.5, 200К

Цифра в названии модели (например, "4" в "Sonnet 4") указывает на версию – чем больше число, тем новее модель. Значение "200К" обозначает контекстное окно модели – количество токенов, которое модель способна обработать в рамках единого контекста.
Особенности работы с контекстом
Все нейросети учитывают контекст беседы – накопленная история диалогов используется при каждом новом запросе. Объем контекста зависит от конкретной нейросети (указывается рядом с моделью в тысячах токенов - "К").
При необходимости начать работу по новой теме рекомендуется создать новый чат и присвоить ему соответствующее название. Вы можете переключаться между чатами, и каждый из них будет готов продолжить диалог в ранее заданной теме с сохраненным контекстом.
Рядом с каждой моделью есть обозначение:
- "Базовые запросы"
- "Стандартные запросы"
- "Продвинутые запросы"
Это означает, в рамках какого тарифного плана доступна данная модель.
Кнопка расположена рядом со списком нейросетей в интерфейсе VisGPT и представлена значком в виде вопросительного знака (?) в круге. Эта кнопка предоставляет доступ к подробной информации о выбранной нейросети и её моделях, что помогает пользователям сделать осознанный выбор инструмента для решения конкретных задач.

- Получение подробной информации: Открывает информационную панель с детальным описанием возможностей и особенностей выбранной нейросети
- Ознакомление с условиями использования: Предоставляет ссылки на официальные документы и политики разработчика нейросети
- Сравнение моделей: Позволяет быстро оценить различия между разными моделями одной нейросети
- Выбор оптимальной модели: Помогает определить, какая модель лучше подходит для конкретной задачи
- Проверка поддерживаемых функций: Показывает, какие типы задач поддерживает каждая модель (обработка текста, создание изображений, программирование и т.д.)
- Перед началом работы: Изучите описание нейросети, чтобы понять её общие возможности и ограничения
- При выборе модели: Сравните доступные модели по размеру контекстного окна и поддерживаемым функциям
- Для специфических задач: Проверьте, поддерживает ли выбранная модель необходимые типы операций (например, работу с кодом или изображениями)
- При работе с конфиденциальной информацией: Ознакомьтесь с политиками конфиденциальности и условиями использования

Кнопка "Написать в техподдержку" располагается рядом с вышеописанными вкладками. При нажатии открывается окно, где вы можете описать свою ситуацию и получить ответ в формате 24/7. Для предоставления ответа потребуется "Согласие на обработку персональных данных".

Располагается внизу рабочей области и содержит следующие элементы:
- Поле ввода запроса/промпта: основное поле для ввода текста запроса к нейросети
- Кнопка "Прикрепить файл": позволяет загрузить документы (.doc, .txt, .xls, .pdf), аудиофайлы (.mp3 до 10 минут) или изображения (.png, .jpeg)

- Кнопка "Использовать промпт": дает доступ к библиотеке готовых промптов и вашим шаблонам на платформе VisGPT

- Кнопка "Добавить дополнительную модель": позволяет подключить другую нейросеть для сравнения генерации ответа

- Кнопка "Буст": увеличивает контекстное окно текущего чата (при включенном режиме отображает количество оставшихся бустов)
Бусты можно приобрести дополнительно, без необходимости обновлять весь тариф

- Кнопка "Использование микрофона": позволяет записать промпт голосом вместо ввода текста

- WizardLM (Microsoft) - 2 8x22B
- Mixtral (Mistral) - 8x7B
- Qwen (Alibaba) - 2.5 coder 32B
- Qwen (Alibaba) - 2.5 72B
- WizardLM (Microsoft) - 2 7B
- Grok (xAI) - 3 Mini Beta
- GLM (THUDM) - 4.1V 9B Thinking
- Hunyuan (Tencent) - A13B Instruct
- Qwen (Alibaba) - 2.5 Turbo
- Qwen (Alibaba) - QwQ 32B Preview
- Nova (Amazon) - Micro 1.0
- Phi (Microsoft) - 4
- Command (Cohere) - R7B (12-2024)
- Gemini (Google) - Flash 2.0
- LFM (Liquid) - 7B
- Gemma (Google) - 2 9B IT
- ChatGPT (OpenAi) - 4o mini
- Gemma (Google) - 2 27B IT
- YandexGPT - 4
- Mixtral (Mistral) - 8x22B
- GigaChat (Сбер) - Plus
- YandexGPT - 5 Pro
- DeepSeek - V3
- Gemini (Google) - Pro 1.5
- Jamba (AI21) - 1.5 Mini
- Ernie (Baidu) - 4.5 300B A47B
- Mercury (Inception) - 1
- Kimi (MoonshotAI) - K2
- Gemini (Google) - Flash 2.5
- Mixtral (Mistral) - Devstral Medium
- Yi (01-AI) - Large
- Nova (Amazon) - Pro 1.0
- Nova (Amazon) - Lite 1.0
- MiniMax Text - minimax-01
- DeepSeek - R1 (new)
- Jamba (AI21) - 1.5 Large
- Qwen (Alibaba) - 2.5 Plus
- Qwen (Alibaba) - 2.5 Max
- ChatGPT (OpenAi) - o3-mini
- ChatGPT (OpenAi) - o1-mini
- ChatGPT (OpenAi) - 4o
- GigaChat (Сбер) - Pro
- GigaChat (Сбер) - Max
- Sonar (Perplexity) - Reasoning Pro
- Grok (xAI) - 3 Beta
- Sonar (Perplexity) - Pro
- Sonar (Perplexity) - Deep Research
- Grok (xAI) - 2 Vision 1212
- Claude (Anthropic) - Sonnet 4
- Grok (xAI) - 4
- Inflection - 3 Pi
- ChatGPT (OpenAi) - o1
- Claude (Anthropic) - 3.5 Sonnet
- Claude (Anthropic) - 3.7 Sonnet
- ChatGPT (OpenAi) - o3
- ChatGPT (OpenAi) - o4-mini
- ChatGPT (OpenAi) - o1 preview
- ChatGPT (OpenAi) - 4.1
Позволяет во время текущего диалога подключить другую нейросеть, сохраняя накопленный контекст беседы. Вы можете:
- Менять нейросети неограниченное количество раз
- Перезапустить тот же вопрос с другой моделью/нейросетью, создавая ветку диалога
- Создавать параллельные ответы от разных моделей
- Выбирать любой из ответов и продолжать диалог в выбранной ветке
- Возвращаться к точке начала ветвления и следовать по другой ветви

При перезагрузке страницы история диалогов выстраивается от ветки с последним по времени запросом. Для поиска сообщений можно использовать функцию поиска, расположенную слева над списком чатов.
Позволяет в одном запросе (промпте) задействовать сразу две модели нейросети для одновременного анализа запроса. После получения ответов вы можете:
- Выбрать наиболее подходящий ответ
- Использовать один ответ за основу, дополняя его лучшими частями из другого
- Продолжить работу с выбранной моделью
Все данные обрабатываются в анонимном режиме – нейросеть получает только ID запроса и его содержимое, без персональной информации о пользователе. При необходимости вы можете:
- Скорректировать данные перед отправкой
- Использовать российские нейросети (GigaChat, YandexGPT, YandexART, Kandinsky)
Функция позволяет анализировать большие массивы данных, делать выводы и формировать рекомендации. Для этого вы можете:
- Загрузить несколько документов
- Сформулировать запрос на анализ
- Получить структурированное резюме с рекомендациями по улучшению и оптимизации
VisGPT – это удобный инструмент для работы с различными нейросетями для бизнеса в едином интерфейсе. Платформа предлагает широкий выбор моделей для решения задач от простых текстовых запросов до комплексного анализа данных.
Функции ветвления диалога и многочатовости позволяют сравнивать ответы различных моделей и выбирать оптимальные решения, повышая эффективность работы. Гибкая система тарификации (базовые, стандартные и продвинутые запросы) помогает подобрать подходящий тарифный план под ваши задачи и бюджет.
Освоив принципы работы с VisGPT, вы сможете эффективно использовать искусственный интеллект для профессиональных и творческих задач.