Ollama

Обзор

Ollama — это инструмент для запуска локальных LLM-моделей. Поддерживает множество форматов моделей и позволяет легко управлять ими через CLI или встроенный интерактивный интерфейс.

Команда Название Описание
ollama Интерактивное меню Запускает интерактивный интерфейс Ollama в терминале. Позволяет быстро запускать модели, выбирать интеграции и открывать дополнительные инструменты без ручного ввода команд. Поддерживает навигацию клавишами ↑ ↓ Enter. Пример: ollama
ollama serve Запуск сервера Запускает Ollama как API-сервис. После запуска API становится доступным по адресу localhost:11434. Используется для интеграции с приложениями и библиотеками. Пример: ollama serve Дополнительно: ollama serve --debug — запуск в отладочном режиме, ollama serve --port <port> — запуск на указанном порту

Запуск моделей

Команда Название Описание
Загрузка и запуск моделей
ollama run <model> Запуск модели Загружает и запускает модель в интерактивном режиме. Если модели нет локально, Ollama автоматически скачает её. Используется для диалогов, тестирования моделей и локальной работы с LLM. Пример: ollama run llama3.2
ollama pull <model> Загрузка модели Скачивает модель из реестра Ollama в локальное хранилище без её запуска. Удобно для предварительной загрузки. Проверка скачивания: ollama list. При скачивании Ollama автоматически обновляется до актуальной версии. Пример: ollama pull gemma3
ollama pull <model> --cloud Загрузка из облака Скачивает модель из Ollama Cloud. Доступно после авторизации или для бесплатных моделей. При скачивании показывается прогресс и используется прокси-сервер для ускорения. Пример: ollama pull mistral:7b --cloud
ollama list Список моделей Показывает все модели, установленные локально. Удобно для просмотра доступных моделей и их версий. Пример: ollama list
ollama ps Активные процессы Показывает модели, которые сейчас загружены в памяти, а также использование CPU/GPU и объём ресурсов. Полезно для диагностики производительности. Пример: ollama ps
ollama show <model> Просмотр информации о модели Выводит информацию о модели: параметры, шаблон, системный prompt и другие данные. Полезно для анализа конфигурации. Пример: ollama show llama3.2
Запуск интеграций
ollama launch Запуск интеграций Открывает меню настройки и запуска внешних приложений, работающих через Ollama. Используется для подключения IDE и AI-инструментов. Пример: ollama launch
ollama launch <integration> Запуск конкретной интеграции Запускает определённую интеграцию напрямую без меню выбора. Подходит для быстрого старта среды разработки или AI-инструмента. Пример: ollama launch codex
ollama launch <integration> --model <model> Запуск интеграции с моделью Позволяет указать конкретную модель для внешнего приложения. Полезно, если используется несколько моделей с разными задачами. Пример: ollama launch codex --model llama3.2
ollama cp <source> <destination> Копирование модели Создаёт копию существующей модели под новым именем. Удобно перед изменением конфигурации или экспериментов. Пример: ollama cp llama3.2 llama3.2-custom
ollama rm <model> Удаление модели Удаляет модель из локального хранилища и освобождает место на диске. Пример: ollama rm llama3.2
ollama create <name> -f <Modelfile> Создание модели Создаёт новую модель на основе Modelfile. Позволяет изменять системные инструкции, параметры, шаблоны и подключать адаптеры. Пример: ollama create mario-ai -f ./Modelfile
ollama pull <model> --latest Обновление модели Обновляет локальную модель до последней версии в реестре. Полезно для получения патчей безопасности и улучшений. При обновлении Ollama проверяет доступность новой версии и показывает разницу в размерах. Пример: ollama pull llama3.2 --latest

Интеграции

Ollama поддерживает различные IDE и инструменты для работы с моделями.

Команда Название Описание
ollama launch Меню интеграций Открывает интерактивное меню для выбора и запуска внешних приложений. Позволяет легко подключать IDE (VS Code, Vim), редакторы и AI-инструменты без сложной конфигурации. Используется в первый раз после установки Ollama. Пример: ollama launch
ollama launch codex Запуск в VS Code Запускает интеграцию с VS Code, открывая плагин Ollama. После запуска можно использовать встроенные chat-окна, автодополнение кода и анализ кода с помощью моделей. Пример: ollama launch codex
ollama launch <integration> --model <model> Запуск с конкретной моделью Запускает интеграцию с указанием конкретной модели. Полезно при использовании нескольких моделей с разными задачами (кодирование, чат, анализ). Пример: ollama launch codex --model qwen2.5:7b

Работа с облаком

Команда Название Описание
ollama signin Авторизация в облаке Выполняет вход в учётную запись Ollama Cloud. Требуется для использования облачных моделей и доступа к платному контенту в реестре. После авторизации можно загружать проприетарные модели и использовать API. Пример: ollama signin
ollama push <model> Публикация модели Отправляет локальную модель или кастомную сборку в удалённый реестр. Обычно применяется при распространении собственных моделей. Требует авторизации для публикации. Пример: ollama push my-assistant

Встроенные команды

Внимание: Некоторые команды могут зависеть от версии Ollama и активной интеграции. Команды /set think работают только с моделями, поддерживающими reasoning/think режим. Встроенные команды доступны только внутри ollama run, а не в обычном CLI.

Команда Название Описание
Помощь и справка
/? Список команд Показывает список доступных встроенных команд текущей интерактивной сессии. Удобно использовать как встроенную справку. Пример: /?
/help Помощь Аналог /?. Отображает подробную информацию по встроенным командам и параметрам. Пример: /help
Управление сессией
/bye Выход из сессии Завершает текущий чат с моделью и выходит из интерактивного режима. Пример: /bye
/clear Очистка контекста Полностью сбрасывает текущий диалог и историю контекста. После выполнения модель начинает новый разговор без предыдущих сообщений. Пример: /clear
Информация о модели
/show info Информация о модели Отображает сведения о текущей модели: имя, размер, архитектуру, параметры и используемые настройки. Пример: /show info
/show modelfile Показ Modelfile Выводит полный Modelfile активной модели. Полезно для анализа системных инструкций, шаблонов и параметров модели. Пример: /show modelfile
/show parameters Параметры модели Показывает текущие параметры генерации и настройки выполнения. Пример: /show parameters
/show system Системный prompt Показывает системную инструкцию (system prompt), используемую текущей моделью. Пример: /show system
/show template Шаблон запросов Отображает используемый шаблон формирования сообщений между пользователем и моделью. Пример: /show template
Форматирование ответов
/set format json JSON-режим Заставляет модель генерировать ответы в JSON-формате. Полезно для API и автоматической обработки данных. Пример: /set format json
/set noformat Отключение форматирования Возвращает обычный текстовый режим ответа. Пример: /set noformat
Статистика и режимы
/set verbose Подробный режим Включает отображение технической информации: скорость генерации, число токенов, время обработки и статистику работы модели. Пример: /set verbose
/set quiet Тихий режим Отключает дополнительную статистику и оставляет только ответы модели. Пример: /set quiet
/set history Включить историю Активирует сохранение истории введённых команд и сообщений. Пример: /set history
/set nohistory Отключить историю Отключает сохранение истории команд текущей сессии. Пример: /set nohistory
/set wordwrap Перенос строк Включает автоматический перенос длинных строк в терминале. Пример: /set wordwrap
/set nowordwrap Отключение переноса Отключает автоматический перенос текста. Полезно для логов и JSON. Пример: /set nowordwrap
Режим рассуждений
/set think Режим рассуждений Включает режим дополнительного внутреннего анализа модели (если модель поддерживает reasoning). Возможны уровни: low, medium, high. Пример: /set think high
/set nothink Отключение рассуждений Отключает режим расширенного анализа. Пример: /set nothink
Параметры генерации
/set parameter temperature <value> Температура генерации Изменяет температуру генерации в реальном времени без перезапуска модели. Меньшие значения делают ответы более предсказуемыми, большие — более креативными. Пример: /set parameter temperature 0.7
/set parameter num_ctx <value> Размер контекста Изменяет размер контекстного окна модели. Увеличение позволяет использовать больше текста, но повышает потребление памяти. Пример: /set parameter num_ctx 8192
Переключение моделей
/load <model> Переключение модели Загружает другую модель прямо во время текущей сессии без выхода из интерактивного режима. Пример: /load qwen3:8b
Ctrl+C Остановка генерации Немедленно прерывает текущую генерацию ответа модели. Пример: Ctrl+C
Ctrl+D Завершение ввода/выход Завершает ввод многострочного сообщения либо завершает текущую интерактивную сессию. Пример: Ctrl+D

Интерактивный режим

Команда Название Описание
Интерактивное меню
ollama Интерактивный интерфейс Запускает интерактивный режим с графическим меню и списком моделей. Позволяет выбирать модели, запускать их и использовать встроенные команды без знания CLI. Навигация: ↑ ↓ Enter. Пример: ollama
ollama <model> Запуск модели через меню Запускает конкретную модель через интерактивное меню Ollama. Меню автоматически показывает все локально установленные модели. Пример: ollama llama3.2
Инструменты
ollama launch Меню интеграций Открывает меню для запуска внешних приложений и IDE. Пример: ollama launch

CLI и помощь

Команда Название Описание
ollama help Справка Показывает список доступных команд и их параметры. Можно использовать как общую справку или для отдельной команды. Пример: ollama help run
ollama --help Общая помощь Показывает общую справочную информацию и перечень команд. Пример: ollama --help
ollama --version Версия Выводит установленную версию Ollama. Используется для проверки совместимости и диагностики. Пример: ollama --version

Сервер

Команда Название Описание
ollama serve Запуск сервера Запускает Ollama как API-сервис. После запуска API становится доступным по адресу localhost:11434. Используется для интеграции с приложениями и библиотеками. Пример: ollama serve
ollama serve --debug Запуск в отладочном режиме Запускает сервер с отладочными сообщениями в консоль. Полезно для диагностики проблем с моделями и интеграциями. Пример: ollama serve --debug
ollama serve --port <port> Запуск на указанном порту Запускает сервер на указанном порту вместо стандартного 11434. Полезно при работе с несколькими инстансами Ollama. Пример: ollama serve --port 11435