Внесение изменений в раздел Быстрый старт
This commit is contained in:
+41
-54
@@ -1,20 +1,7 @@
|
||||
# Чат с LLM
|
||||
## Обзор сервиса Чат с LLM
|
||||
|
||||
**Чат с LLM -** это интуитивно понятный интерфейс для общения с LLM (Large Language Model). Подходит для знакомства с моделями, а также для встраивания на любой сайт в виде виджета. Чат дает возможность выбирать различные LLM модели, базы знаний и настраивать системные промпты под свои задачи.
|
||||
|
||||
**LLM** — это просто большая куча матриц и векторной алгебры, которая обучается на огромном количестве текстов. В процессе обучения модель не просто запоминает информацию, а учится находить связи между словами, понимать закономерности языка и генерировать осмысленные ответы на самые разные вопросы. Когда вы задаёте LLM вопрос, она «вспоминает» подходящие по смыслу фразы и пытается предугадать, какие слова должны идти дальше, чтобы ответ звучал логично и понятно.
|
||||
|
||||
## Быстрый старт
|
||||
|
||||
Для авторизации и начала работы необходимо выполнить следующие шаги:
|
||||
|
||||
1. **Подключение**: Перейдите по адресу `ai.beeline.ru`
|
||||
2. **VPN/VDL**: Обязательно подключитесь через корпоративный VPN или VDL
|
||||
3. **Авторизация**: Нажмите «Начать работу» или «Перейти в чат»
|
||||
4. **MobileID**: Пройдите стандартную авторизацию через MobileID
|
||||
5. **Начало работы**: После авторизации вы попадете в интерфейс чата
|
||||
|
||||
**Чат с LLM** — это интуитивно понятный интерфейс для общения с LLM (Large Language Model). Подходит для знакомства с моделями, а также для встраивания на любой сайт в виде виджета. Чат дает возможность выбирать различные LLM модели, базы знаний и настраивать системные промпты под свои задачи.
|
||||
|
||||
**Интерфейс чата:**
|
||||
|
||||
@@ -23,17 +10,24 @@
|
||||
В интерфейсе доступен следующий функционал:
|
||||
|
||||
1. **Выбор модели:**
|
||||
По умолчанию используется модель Gemma 3. Для смены модели выберите подходящий вариант из выпадающего меню. Рекомендации по выбору модели доступны в разделе [Доступные модели](#ai-getting-started-).
|
||||
По умолчанию используется модель Gemma 3. Для смены модели выберите подходящий вариант из выпадающего меню.
|
||||
|
||||
Рекомендации по выбору модели доступны в разделе [Доступные модели](#ai-chat-llm-Дотупные-модели).
|
||||
|
||||
2. **Выбор базы знаний:**
|
||||
Для генерации ответов не на базе своего раннего обучения, а на основе актуальных данных, необходимо выбрать нужную базу знаний из выпадающего меню. Более подробно, что такое "Базы знаний" в AI и как они работают, можно ознакомится в разделе [RAG](#Likbez-RAG).
|
||||
Для генерации ответов не на базе своего раннего обучения, а на основе актуальных данных, необходимо выбрать нужную базу знаний из выпадающего меню.
|
||||
|
||||
Более подробно, что такое "Базы знаний" в AI и как они работают, можно ознакомится в разделе [Базы знаний](#ai-chat-llm-База-знаний).
|
||||
|
||||
3. **Выбор системного промпта:**
|
||||
Системный промпт представляет из себя набор инструкций, на которые опирается модель при подготовке ответа на запрос пользователя.
|
||||
Подробно про промпты можно почитать тут: [Промпты](#Likbez-Prompt)
|
||||
|
||||
Подробно про промпты можно почитать тут: [Промпты](#ai-chat-llm-Промпты)
|
||||
|
||||
4. **Очистка контекста диалога:**
|
||||
При длительном диалоге модель накапливает контекст и может начать генерировать неточные ответы ("галлюцинации"). Для предотвращения этого рекомендуется периодически очищать контекст сессии — нажмите иконку очистки в правом верхнем углу окна чата. Подробно про ограничения LLM можно почитать тут: [Ограничения LLM](#Likbez-RestrLLM)
|
||||
При длительном диалоге модель накапливает контекст и может начать генерировать неточные ответы ("галлюцинации"). Для предотвращения этого рекомендуется периодически очищать контекст сессии — нажмите иконку очистки в правом верхнем углу окна чата.
|
||||
|
||||
Подробно про ограничения LLM можно почитать тут: [Ограничения LLM](#LLM)
|
||||
|
||||
5. **Диалог пользователя с чатом**
|
||||
Диалог с чатом пользователь ведёт как в обычном чате в режиме вопрос-ответ.
|
||||
@@ -42,16 +36,24 @@
|
||||
|
||||

|
||||
|
||||
## Выбор LLM
|
||||
## Быстрый старт
|
||||
|
||||
Первым шагом надо выбрать одну из доступных моделей.
|
||||
Для авторизации и начала работы с чатом необходимо выполнить следующие шаги:
|
||||
|
||||
1. **Подключение**: Перейдите по адресу `ai.beeline.ru`
|
||||
2. **VPN/VDL**: Обязательно подключитесь через корпоративный VPN или VDL
|
||||
3. **Авторизация**: Нажмите «Начать работу» или «Перейти в чат»
|
||||
4. **MobileID**: Пройдите стандартную авторизацию через MobileID
|
||||
5. **Начало работы**: После авторизации вы попадете в интерфейс чата
|
||||
|
||||
## Выбор LLM
|
||||
|
||||
Следующим шагом надо выбрать одну из доступных моделей.
|
||||
|
||||

|
||||
|
||||
По умолчанию установлена модель Gemma 3, но мы рекомендуем начинать эксперименты с модели Qwen 3 32B, которая имеет больший контекст, поддерживает нативный вызов инструментов, а также может работать как в режиме с рассуждениями (включен по умолчанию) или без них - в таком случае нужно передать в запросе "/no_think".
|
||||
С списанием, какие модели доступны, а также, какие преимущества есть у каждой из моделей, можно ознакомиться в разделе [Доступные модели](#Available-LLMs).
|
||||
|
||||
После выбора модели можно начинать диалог с чатом. Для этого необходимо просто писать свой запрос в окно диалога и дожидаться ответа.
|
||||
С списанием, какие модели доступны, а также, какие преимущества есть у каждой из моделей, можно ознакомиться в разделе [Доступные модели](#Доступные-модели).
|
||||
|
||||
## Доступные модели
|
||||
|
||||
@@ -63,6 +65,9 @@
|
||||
| Gemma 3 | 128k | 27B | ❌ | ❌ | ✅ |
|
||||
| Qwen 3 | 131k | 32B | ✅ |✅ | ❌|
|
||||
|
||||
<details>
|
||||
<summary> Описание доступных моделей </summary>
|
||||
|
||||
* **DeepSeek Chat**
|
||||
|
||||
Обновление DeepSeek V3 — это мощная гибридная модель с 671 млрд параметров, специально оптимизированная для кодогенерации и работы поисковых агентов. Модель поддерживает контекст до 128 тыс. токенов и позволяет гибко управлять режимом рассушений через параметр "reasoning_enabled". Она демонстрирует производительность уровня DeepSeek-R1, но работает быстрее, идеально подходя для программирования, исследований и агентных workflow.
|
||||
@@ -78,22 +83,16 @@
|
||||
1. с рассуждениями (включен по умолчанию)
|
||||
2. без рассуждений (нужно передать в запросе /no_think).
|
||||
|
||||
</details>
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
#### После выбора модели можно начинать диалог с чатом. Для этого необходимо просто писать свой запрос в окно диалога и дожидаться ответа.
|
||||
|
||||
# Ликбез
|
||||
|
||||
## Что такое LLM
|
||||
|
||||
Представьте, что у вас есть программа, которая прочитала миллионы книг, статей и страниц из интернета, а потом научилась предсказывать, какие слова могут идти друг за другом в любом тексте. Примерно так устроена большая языковая модель, или LLM (Large Language Model).
|
||||
|
||||
LLM — это просто большая куча матриц и векторной алгебры, которая обучается на огромном количестве текстов. В процессе обучения модель не просто запоминает информацию, а учится находить связи между словами, понимать закономерности языка и генерировать осмысленные ответы на самые разные вопросы. Когда вы задаёте LLM вопрос, она «вспоминает» подходящие по смыслу фразы и пытается предугадать, какие слова должны идти дальше, чтобы ответ звучал логично и понятно.
|
||||
**LLM** — это просто большая куча матриц и векторной алгебры, которая обучается на огромном количестве текстов. В процессе обучения модель не просто запоминает информацию, а учится находить связи между словами, понимать закономерности языка и генерировать осмысленные ответы на самые разные вопросы. Когда вы задаёте LLM вопрос, она «вспоминает» подходящие по смыслу фразы и пытается предугадать, какие слова должны идти дальше, чтобы ответ звучал логично и понятно.
|
||||
|
||||
### Как LLM формирует ответы
|
||||
Когда вы отправляете запрос, LLM делает следующее:
|
||||
@@ -106,36 +105,24 @@ LLM — это просто большая куча матриц и вектор
|
||||
Важно отметить, что все ответы LLM вероятностные, т. е. на один и тот же вопрос модель всегда будет отвечать немного по-разному. Именно поэтому ответы LLM могут выглядеть очень разумными и логичными, но при этом модель может допускать ошибки — она не всегда «понимает» информацию так, как это сделал бы человек.
|
||||
|
||||
### Ограничения LLM
|
||||
Несмотря на впечатляющие возможности, у LLM есть важные ограничения:
|
||||
Языковые модели обладают рядом принципиальных ограничений, которые важно учитывать при работе с ними:
|
||||
|
||||
- Ограниченный контекст:
|
||||
- **Ограниченный контекст** — модель одновременно обрабатывает только определенный объем текста (обычно несколько тысяч слов). При превышении этого лимита ранние части диалога "забываются", что приводит к потере контекста в продолжительных беседах.
|
||||
|
||||
Модель может учитывать только ограниченный объём текста одновременно (например, несколько страниц). Всё, что выходит за рамки этого объёма, модель уже не «помнит». Именно поэтому очень длинные запросы могут привести к потере важных деталей или неточностям.
|
||||
- **Отсутствие долговременной памяти** — модель не запоминает предыдущие разговоры. Каждый новый запрос обрабатывается изолированно, а поддержание диалога требует постоянной пересылки всей истории.
|
||||
|
||||
- Отсутствие долгосрочной памяти:
|
||||
- **Временное ограничение знаний** — обучение модели завершено на определенную дату (например, октябрь 2023 года). События и информация после этой даты модели неизвестны без дополнительных источников.
|
||||
|
||||
LLM не запоминает предыдущие разговоры и даже предыдущие реплики. Каждая реплика LLM формируется только на основе одного запроса, поданного ей на вход. «Диалоги», которые мы ведём с LLM — это, на самом деле, эмуляция. Для того, чтобы получить следующую реплику от LLM, наш UI собирает вместе всю накопленную историю диалога и подаёт её на вход LLM. Именно поэтому контекст LLM расходуется по мере ведения диалога: с каждой новой репликой объём накопленной истории растёт, и в нём остаётся всё меньше места для новых реплик.
|
||||
- **Вероятностная природа** — модель не обладает сознанием или реальным пониманием мира. Она генерирует ответы на основе статистических закономерностей, выученных из обучающих данных.
|
||||
|
||||
- Knowledge cutoff (ограничение знаний по времени):
|
||||
- **Склонность к галлюцинациям** — модель может генерировать правдоподобную, но фактически неверную информацию, особенно в узкоспециализированных темах или при недостатке релевантных данных.
|
||||
|
||||
LLM обучается на данных, собранных до определённой даты (например, октябрь 2023 года). Всё, что произошло после этой даты, модель не знает и не может учитывать. Поэтому она не может отвечать на вопросы о текущих событиях и последних новостях без дополнительных источников.
|
||||
- **Неспособность к точным вычислениям** — модель не выполняет математические операции, а предсказывает наиболее вероятный ответ. Для точных расчетов рекомендуется использовать связку "генерация кода → выполнение в интерпретаторе → анализ результата".
|
||||
|
||||
- Отсутствие истинного понимания:
|
||||
|
||||
Хотя ответы LLM могут звучать уверенно и убедительно, модель не обладает сознанием, жизненным опытом или настоящим пониманием мира. Она только имитирует понимание, основываясь на статистике и шаблонах, выученных из огромного массива текста.
|
||||
|
||||
- Галлюцинации:
|
||||
|
||||
Иногда LLM может генерировать правдоподобно звучащую, но неверную информацию. Это происходит потому, что модель конструирует ответ на основе вероятностей, а не проверяет факты в реальном времени. В обучающей выборке могло быть мало данных о какой-то узкой области знаний, и LLM пытается «придумать» наиболее вероятный ответ. Например, если мы будем спрашивать модель без дополнительных баз знаний про билайн, она сможет выдать только очень базовую публичную информацию, но ничего не скажет о внутренних регламентах или о том, кто сейчас генеральный директор.
|
||||
|
||||
- Модели не умеют считать:
|
||||
|
||||
LLM просто предсказывают следующий токен на основании всех предыдущих, и это значит, что модель не может выполнять математические операции в их традиционном понимании. Если вы попросите модель сложить 2 + 2, она, скорее всего, выдаст вам правильный ответ, но не потому что она произвела арифметическое действие, а потому что видела ответ в обучающих данных. Более того, «рассуждающие» модели могут сгенерировать правдоподобное арифметическое объяснение для полученного результата, но исследования показывают, что результирующее число модель получает с помощью неточных веростностных операций, а «правильное» объяснение генерирует только потому что именно такие ответы успешно проходили проверку на этапе обучения. Таким образом, если вы хотите делать точный анализ числовых данных, вы не должны рассчитывать только на саму LLM. Правильный способ решения этой задачи — позволить модели сгенерировать код на Python или JavaScript, выполнить этот код в интерпретаторе, передать результат выполнения в LLM и дать ей сформировать финальный ответ.
|
||||
|
||||
LLM — это, в первую очередь, программа для вероятностной обработки текста. Она может находить закономерности в больших объёмах данных, может генерировать тексты и изображения. Но сами по себе LLM не являются заменой специализированным системам: CRM, и, тем более, BI-движкам. Для решения аналитических задач вокруг LLM должны быть построены дополнительные возможности и обвязки: базы знаний, интеграции с внешними системами, интерпретаторы кода.
|
||||
LLM эффективны для обработки текста и решения стандартных задач, но для сложных кейсов требуют дополнительной инфраструктуры — баз знаний, интеграций с внешними системами и инструментов выполнения кода.
|
||||
|
||||
|
||||
### Схема работы LLM с базой знаний
|
||||
|
||||

|
||||
|
||||
|
||||
#### Схема работы LLM с базой знаний
|
||||
|
||||
@@ -6,11 +6,13 @@
|
||||
1. Создать тенант.
|
||||
2. Добавить модель.
|
||||
3. Перейти в чат с LLM.
|
||||
4. Редактровать промпт.
|
||||
5. Создать базу знаний.
|
||||
4. Создать базу знаний.
|
||||
5. Редактровать промпт.
|
||||
6. Задать вопрос модели.
|
||||
|
||||
## Регистрация в Beeline Cloud
|
||||
## Перед началом работы
|
||||
|
||||
Зарегистрируйтесь в личном кабинете **Beeline Cloud**:
|
||||
|
||||
- Перейдите по ссылке [lk.cloud.beeline.ru](https://lk.cloud.beeline.ru/) и нажмите кнопку **Войти** в правом верхнем углу.
|
||||
- Введите **номер телефона** любого оператора связи и нажмите кнопку **Войти**.
|
||||
@@ -34,35 +36,49 @@
|
||||
|
||||
## 1. Создать тенант
|
||||
|
||||
1. Откройте личный кабинет Beeline Cloud.
|
||||
2. Откройте раздел **AI Platform → Тенант**.
|
||||
3. Нажмите кнопку **Создать тенант**.
|
||||
4. Введите имя тенанта.
|
||||
5. Нажмите **Создать тенант**.
|
||||
1. Войдите в [личный кабинет](https://lk.cloud.beeline.ru/).
|
||||
2. В верхнем меню нажмите на пункт **Сервисы**.
|
||||
3. Выберите **Сервис AI Platform**.
|
||||
4. В левом меню откройте раздел **Тенанты**.
|
||||
5. Нажмите кнопку **Создать тенант**.
|
||||
6. Введите имя тенанта.
|
||||
7. Нажмите **Создать тенант**.
|
||||
|
||||
## 2. Добавить модель
|
||||
|
||||
1. Нажмиите на раздел **Моедель**.
|
||||
2. Выберите из списка подходящую **LLM-модель**.
|
||||
3. Установите лимит использования **токенов в час**.
|
||||
4. Завершите процесс кнопкой **Добавить модель**.
|
||||
1. Войдите в [личный кабинет](https://lk.cloud.beeline.ru/).
|
||||
2. В левом меню откройте раздел **Модель**.
|
||||
3. Нажмите кнопку **Добавить модель**.
|
||||
3. В поле Тенант выберите созданный тенант.
|
||||
4. В поле **Модель** выберите из списка **LLM-модель**.
|
||||
5. Установите лимит использования **[токенов](#ai-overview-platform.md) в час**.
|
||||
6. Нажмите **Добавить модель**.
|
||||
|
||||
## 3. Переход в UI AI Platform
|
||||
|
||||
После входа в личный кабинет beeline cloud вы попадаете в AI Platform [**чат с LLM-моделями**](#ai-chat-llm.md).
|
||||
|
||||
UI AI Platform также доступен по ссылке https://chat.ai.beeline.ru/.
|
||||
|
||||
## 4. Добавить базу знаний
|
||||
|
||||
1. Нажмите **База знаний**.
|
||||
2. Выберите из списка или [добавьте новую базу знаний](ai-setting#создать-базу-знаний).
|
||||
1. Войдите в [личный кабинет](https://lk.cloud.beeline.ru/).
|
||||
2. Перейдите в AI Platform [**чат с LLM-моделями**](#ai-chat-llm.md).
|
||||
3. В левом меню откройте раздел **База знаний**
|
||||
4. Нажмите [Создать базу знаний](#4-добавить-базу-знаний).
|
||||
5. Заполните параметры базу знаний:
|
||||
- **Тенант**: выберите из списка тенант.
|
||||
- **Имя**: введите имя базы знаний.
|
||||
- **Описание**: введите описание базы знаний.
|
||||
6. Нажмите **Создать базу знаний**.
|
||||
|
||||
## 5. Добавить промпт
|
||||
|
||||
1. Нажмите **Промпт**.
|
||||
2. Выберите из списка подходящий промпт или [добавьте новый промпт](ai-setting#создать-промпт).
|
||||
1. Войдите в [личный кабинет](https://lk.cloud.beeline.ru/).
|
||||
2. Перейдите в AI Platform [**чат с LLM-моделями**](#ai-chat-llm.md).
|
||||
3. В левом меню откройте раздел **Системные промпты**.
|
||||
- Если системный промпт (по умолчанию) не походит для ответа, [добавьте новый промпт](#5-добавить-промпт).
|
||||
|
||||
## 6. Отправить запрос к модели
|
||||
|
||||
После выполнения всех этапов настройки система готова к работе. Для начала взаимодействия с [чатом с LLM-моделями](#ai-chat-llm.md) введите ваш запрос и ожидайте ответа модели.
|
||||
1. В [чате с LLM-моделями](#ai-chat-llm.md) перейдите в раздел **Чат**.
|
||||
2. Откроется чат. В текстовом поле **введите запрос к LLM-модели**.
|
||||
3. Дождитесь ответа модели.
|
||||
|
||||
@@ -47,3 +47,28 @@
|
||||
|
||||
**Системное сообщение (Prompt)**: Системный промпт определяет логику ответов модели. Есть возможность настраивать шаблон запроса.
|
||||
|
||||
## Ликбез
|
||||
|
||||
### Промпты
|
||||
LLM — это вычислительная машина, интерфейс которой эмулирует человеческую речь. Формулируйте запросы четко и точно, как при программировании. Избегайте расплывчатых вопросов — это ключ к получению качественных ответов.
|
||||
|
||||
### Cистемные промпты
|
||||
Специальные инструкции, определяющие поведение модели на протяжении всего диалога. Задают роль, стиль общения и ограничения. На нашей платформе системные промпты открыты для редактирования, что дает полный контроль над поведением ИИ.
|
||||
|
||||
*Пример системного промпта: «Ты — помощник по финансовым вопросам. Отвечай четко и профессионально, используй только проверенную информацию». После установки такого промпта модель будет последовательно придерживаться заданной роли.*
|
||||
|
||||
### Контекст
|
||||
Вы будете часто встречать слово «контекст» в отношении LLM. Упрощённо, контекст — это ограниченное по размеру окно, в которое должен уместиться запрос к LLM. У каждой модели контекст строго ограничен и указан в документации к ней.
|
||||
|
||||
### Токены
|
||||
Внутри себя LLM представляет текст не в виде слов или букв, а в виде токенов. Обычно токен — это несколько букв (часть слова), которые часто встречаются рядом в обучающей выборке. Текст запроса, который вы отправляете в LLM, сначала нарезается на токены, и только потом обрабатывается моделью. Размер контекста также измеряется в токенах, а не в буквах.
|
||||
|
||||
Нет фиксированного правила, которое позволит оценить размер текста в токенах. У каждой модели свой токенизатор, и все они нарезают текст по-своему. Более того, для английского текста средний размер токена можеть быть 4 буквы, а для русского или китайского каждая буква может получать отдельный токен.
|
||||
|
||||
## Базы знаний (RAG)
|
||||
RAG (Retrieval-Augmented Generation) — это подход, при котором ответ LLM формируется с использованием дополнительного источника актуальных данных.
|
||||
|
||||
Базы знаний (RAG) решают ключевую проблему языковых моделей — работу с актуальными и специализированными данными. Когда вы задаете вопрос о внутренних регламентах компании или о событиях после даты обучения модели, стандартная LLM не может дать точный ответ. RAG решает это путем поиска в вашей базе документов релевантных фрагментов, которые затем добавляются к контексту запроса. Модель получает эти актуальные данные и формирует ответ на их основе. Это позволяет использовать LLM для работы с внутренней документацией, свежей информацией и специализированными знаниями, которые изначально отсутствовали в обучающей выборке модели.
|
||||
|
||||
*Обратите внимание, что в традиционной реализации LLM участвует только на последнем этапе генерации ответа. За поиск релевантных документов отвечает набор других систем, которые должны быть заранее интегрированы в AI-платформу.*
|
||||
|
||||
|
||||
+11
-8
@@ -1,14 +1,18 @@
|
||||
# Настройка / управление сервсиом
|
||||
|
||||
ДАнное руководство описывает процедуру настройки и управлением AI Platform для работы с сервисом.
|
||||
|
||||
## Создать тенант
|
||||
|
||||
1. Войдите в консоль управления.
|
||||
2. Откройте раздел **AI Platform → Тенант**.
|
||||
3. Нажмите кнопку **Создать тенант**.
|
||||
4. Введите имя тенанта.
|
||||
5. Нажмите **Создать тенант**.
|
||||
1. Войдите в [личный кабинет](https://lk.cloud.beeline.ru/).
|
||||
2. В верхнем меню нажмите на пункт **Сервисы**.
|
||||
3. Выберите **Сервис AI Platform**.
|
||||
4. В левом меню откройте раздел **Тенанты**.
|
||||
5. Нажмите кнопку **Создать тенант**.
|
||||
6. Введите имя тенанта.
|
||||
7. Нажмите **Создать тенант**.
|
||||
|
||||
## Создать модель <!--НУЖНО УТОЧНИТЬ -->
|
||||
## Создать модель <!--НУЖНО УТОЧНИТЬ ЗА ТОКЕНЫ -->
|
||||
|
||||
1. Перейдите в раздел **AI Platform → Модель**.
|
||||
2. Нажмите кнопку **Добавить модель**.
|
||||
@@ -53,7 +57,7 @@
|
||||
- **Содержание**: введите содержание промпта.
|
||||
5. Нажмите **Создать**.
|
||||
|
||||
### Редактирование системного промпта
|
||||
### Редактирование системного промпта
|
||||
|
||||
Системный промпт представляет из себя набор инструкций, на которые опирается модель при подготовке ответа на запрос пользователя.
|
||||
Наприме, по умолчанию задан простой, "размытый" промпт, который просто указывает, что чат должен быть полезным. Но, такой чат не всегда сможет предоставить пользователю ответ, который его устроит. Поэтому, фунционал Чат с LLM предоставляет возможность задать пользователю свой промпт, который будет действовать в текущей сессии.
|
||||
@@ -74,4 +78,3 @@
|
||||
3. В таблице найдите строку с нужным ресурсом.
|
||||
4. Нажмите … и выберите **Удалить**.
|
||||
5. В открывшемся окне подтвердите операцию, нажав **Удалить**.
|
||||
|
||||
|
||||
@@ -1,96 +0,0 @@
|
||||
|
||||
- ## Обзор сервиса AI Platform
|
||||
- что за сервис / возможности / РМ / Глоссарий /
|
||||
- **внутренние модели** : перечень моделей (таблица) / именование / описаине моделей
|
||||
- **внешние модели** : как пользоваться / перечень моделей (таблица) / описаине моделей
|
||||
- чат с LLM
|
||||
- создание тенанта (ссылка на настройку)
|
||||
|
||||
- ## Быстрый старт
|
||||
- (прикиннуть быстрое начала страта отправить на согласоание для уточненя деталей - основа действий)
|
||||
|
||||
1. Открыть консоль beeline cloud, перейти в сервис «AI песочница».
|
||||
2. Создать тенант.
|
||||
3. Добавить модель.
|
||||
4. Перейти по сформированный ссылке в чат с LLM.
|
||||
5. Отправить запрос к модели.
|
||||
1. AI-песочницу мы переименовали в AI-платформу.
|
||||
Добавить:
|
||||
2. Создание базы знаний
|
||||
3. Создание промпта
|
||||
|
||||
|
||||
## Ликбез (объеденить с чатом)
|
||||
- **LLM** : что это такое / как формируется ответ / контекст / токены / ограничения LLM /
|
||||
- **промты** : что это / как работают / системные / как они влияют на ответ / как их использвовать
|
||||
- **БЗ** :что это / термины / схема работы / когда подходят
|
||||
- **Рассуждения** : что это / как работает / когда использовать / ограничения
|
||||
- **инструменты** : что это / как работает / как работает с БЗ / схема работы / когда использовать / + и -
|
||||
|
||||
- ## Чат с LLM
|
||||
- **обзор на чат**
|
||||
- **быстрый старт** : что такое чат с LLM / как попасть /интерфейс чата / схема
|
||||
- **LLM** : шаги выбора + UI
|
||||
- **БЗ** : шаги выбора + UI
|
||||
- **промпты** : шаги выбора + UI
|
||||
- **тенанта** : что это / шаги + UI
|
||||
|
||||
- ## Настройка / управление сервсиом
|
||||
- **настройка и создание тенанта**
|
||||
- **настройка LLM**
|
||||
- **ограничения для сервиса** ограничения на кол-во ресурсов (ВРМ, тарифы и тд)
|
||||
|
||||
|
||||
**Термины:**
|
||||
|
||||
// LLM (большие языковые модели) - модель для генерации текста / ответа
|
||||
|
||||
// Тенант - логический контейнер, ктоорый собирается в результате комбинации выбранной модели и БЗ в рамках проекта
|
||||
|
||||
// Промпт - сообщение от пользователя
|
||||
|
||||
// Контекст диалога - история общения с LLM
|
||||
|
||||
// БЗ (RAG) - контейнер для док-ов от пользователя
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
**1.1. Получение токена rnd_admin**:
|
||||
|
||||
- Авторизуйтесь в системе через _ADFS (Active Directory Federation Services)_, например, через Beeline SSO.
|
||||
- Получите _внешний токен_ (ADFS-токен).
|
||||
- Обменяйте ADFS-токен на внутренний JWT (JSON Web Token) через метод:
|
||||
|
||||
POST /api/token/generate
|
||||
Body: { "token": "ваш_ADFS_токен" }
|
||||
→ В ответе получите JWT с правами rnd_admin.
|
||||
|
||||
|
||||
1.2. Создание тенанта
|
||||
Используя токен rnd_admin, отправьте запрос:text
|
||||
POST /api/tenants
|
||||
Body: { "code": "demo_tenant", "name": "Demo Tenant" }
|
||||
→ В ответе получите tenant_id.
|
||||
|
||||
2. Управление ролями и пользователями
|
||||
2.1. Создание роли
|
||||
Отправьте запрос:
|
||||
POST /api/roles
|
||||
Body: { "name": "demo_role", "description": "Demo Role" }
|
||||
→ В ответе получите role_id.
|
||||
2.2. Добавление пользователя в тенант
|
||||
Убедитесь, что пользователь существует в Identity Service.
|
||||
Свяжите пользователя с ролью и тенантом:text
|
||||
POST /api/user-roles
|
||||
Body: {
|
||||
"user_email": "user@example.com",
|
||||
"role_name": "demo_role",
|
||||
"tenant_code": "demo_tenant"
|
||||
}
|
||||
2.3. Получение токена для тенанта
|
||||
Авторизуйтесь через ADFS и получите новый JWT, указав tenant_code:text
|
||||
POST /api/token/generate
|
||||
Body: { "token": "ADFS_токен", "tenant_code": "demo_tenant" }
|
||||
→ В ответе будет токен с ограниченными правами (только для этого тенанта).
|
||||
Reference in New Issue
Block a user