Опубликовано: 28 апреля 2025 г., Последнее обновление: 21 мая 2025 г.
Стремительное развитие ИИ открывает новые горизонты для веб-приложений, особенно с появлением возможностей на устройстве. Узнайте, как CyberAgent, ведущая японская интернет-компания, использует встроенный ИИ Chrome и API Prompt для улучшения опыта ведения блогов на своей платформе Ameba Blog .
Мы рассказываем об их целях, преимуществах работы со встроенным ИИ, проблемах, с которыми они столкнулись, и ценной информации для других разработчиков, использующих встроенный ИИ.
Что такое API Prompt?
Объяснитель | Веб | Расширения | Статус Хрома | Намерение |
---|---|---|---|---|
GitHub | Вид | Намерение экспериментировать |
API Prompt помогает разработчикам использовать большие языковые модели для добавления функций ИИ непосредственно в свои приложения. Определяя пользовательские подсказки, приложения могут выполнять такие задачи, как извлечение данных, генерация контента и персонализированные ответы. В Chrome API Prompt выполняет вывод на стороне клиента с помощью Gemini Nano . Эта локальная обработка, независимо от используемой модели, повышает конфиденциальность данных и скорость ответа. Какая бы модель ни использовалась, скорость ответа клиента.
Помощь искусственного интеллекта авторам блога Ameba
CyberAgent распознал общую болевую точку для авторов: часто отнимающий много времени процесс создания убедительного контента, особенно заголовков. Они выдвинули гипотезу, что интеграция функций на базе ИИ в интерфейс создания блога может значительно повысить качество и эффективность создания контента. Их целью было предоставить инструменты, которые вдохновляют и помогают блогерам создавать увлекательный контент.
CyberAgent разработал расширение Chrome с API Prompt. Это расширение предоставляет набор функций на базе ИИ, призванных помочь авторам блога Ameba генерировать заголовки и названия, последующие абзацы и общие улучшения текста.
CyberAgent хотел гибкости возможностей, что привело прямо к Prompt API. Имея бесконечные возможности в одном API, CyberAgent смог точно определить, что будет работать лучше всего и будет наиболее полезным для авторов Ameba.
CyberAgent протестировал расширение с избранным количеством блогеров, которые дали ценные идеи о практичности предлагаемых функций. Обратная связь помогла CyberAgent определить лучшие приложения для помощи ИИ и усовершенствовать дизайн расширения. Основываясь на положительных результатах и обратной связи, CyberAgent планирует выпустить эту функцию в будущем, предоставив возможности клиентского ИИ непосредственно своему сообществу блогеров.
Давайте подробнее рассмотрим эти особенности.
Пишите лучшие заголовки и заголовки
Расширение генерирует несколько вариантов заголовков на основе полного содержания блога. Авторы блогов могут дополнительно уточнить эти предложения с помощью опций, которые включают: «Регенерировать», «Более вежливо», «Более неформально» или «Создать похожие заголовки» и многое другое.
CyberAgent специально разработал пользовательский интерфейс, чтобы пользователям не приходилось писать никаких подсказок. Таким образом, любые пользователи, не знакомые с разработкой подсказок, также могут воспользоваться мощью ИИ.
Расширение также может генерировать привлекательные заголовки для отдельных разделов блога, которые авторы могут запросить, выбрав соответствующий текст для заголовка.
Код для генерации заголовка с помощью API Prompt включает начальный запрос и запрос пользователя. Начальный запрос дает контекст и инструкции для получения определенного типа вывода, тогда как запросы пользователя просят модель взаимодействовать с тем, что пишет пользователь. Подробнее об их коде читайте в разделе Deploy AI assistance .
Сгенерировать последующие абзацы
Расширение помогает блогерам преодолеть писательский кризис, создавая последующие абзацы на основе выбранного текста. Используя контекст предыдущего абзаца, ИИ составляет продолжение абзаца, позволяя авторам поддерживать свой творческий поток.
Улучшить и отредактировать текст
Gemini Nano анализирует выбранный текст и может предложить улучшения. Пользователи могут регенерировать улучшения с дополнительными заметками по тону и выбору языка, чтобы сделать копию «симпатичнее» или «проще».
Развертывание помощи ИИ
CyberAgent разбил свой код расширения на три этапа: создание сеанса, запуск и запрос модели.
Сначала они проверяют с помощью браузера, что встроенный ИИ доступен и поддерживается. Если да, они создают сеанс с параметрами по умолчанию.
if (!LanguageModel) {
// Detect the feature and display "Not Supported" message as needed
return;
}
// Define default values for topK and temperature within the application
const DEFAULT_TOP_K = 3;
const DEFAULT_TEMPERATURE = 1;
let session = null;
async function createAISession({ initialPrompts, topK, temperature } = {}) {
const { available, defaultTopK, maxTopK, defaultTemperature } =
await LanguageModel.availability();
// "readily", "after-download", or "no"
if (available === "no") {
return Promise.reject(new Error('AI not available'));
}
const params = {
monitor(monitor) {
monitor.addEventListener('downloadprogress', event => {
console.log(`Downloaded: ${event.loaded} of ${event.total} bytes.`);
});
},
initialPrompts: initialPrompts || '',
topK: topK || defaultTopK,
temperature: temperature || defaultTemperature,
};
session = await LanguageModel.create(params);
return session;
}
Каждая функция имеет вспомогательную функцию, активируемую пользователем. После активации, когда пользователь нажимает соответствующую кнопку, они обновляют сеанс соответствующим образом.
async function updateSession({ initialPrompts, topK, temperature } = {
topK: DEFAULT_TOP_K,
temperature: DEFAULT_TEMPERATURE,
}) {
if (session) {
session.destroy();
session = null;
}
session = await createAISession({
initialPrompts,
topK,
temperature,
});
}
После обновления сеанса они подсказывают модели в соответствии с функцией. Например, вот код для генерации заголовка и повторной генерации заголовка с более формальным тоном.
async function generateTitle() {
// Initialize the model session
await updateSession({
initialPrompts: [
{ role: 'system',
content: `Create 3 titles suitable for the blog post's content,
within 128 characters, and respond in JSON array format.`,
}
]
});
const prompt = `Create a title for the following
blog post.${textareaEl.textContent}`;
const result = await session.prompt(prompt);
try {
const fixedJson = fixJSON(result);
// display result
displayResult(fixedJSON);
} catch (error) {
// display error
displayError();
}
}
async function generateMoreFormalTitle() {
// Do not execute updateSession to reuse the session during regeneration
const prompt = 'Create a more formal title.';
const result = await session.prompt(prompt);
...
}
Преимущества встроенного ИИ
Встроенный ИИ — это тип клиентского ИИ , что означает, что вывод происходит на устройстве пользователя. CyberAgent решила использовать встроенные API ИИ с Gemini Nano из-за убедительных преимуществ, которые он предлагает как разработчикам приложений, так и пользователям.
Основные преимущества, на которых фокусируется CyberAgent, включают в себя:
- Безопасность и конфиденциальность
- Расходы
- Оперативность и надежность
- Простота разработки
Безопасность и конфиденциальность
Возможность запускать модели ИИ непосредственно на устройстве пользователя без передачи данных на внешние серверы имеет первостепенное значение. Черновики блогов не предназначены для просмотра публикой, и поэтому CyberAgent не хочет отправлять эти черновики на сторонний сервер.
Встроенный ИИ загружает Gemini Nano на пользовательские устройства, устраняя необходимость отправлять и получать данные с серверов. Это особенно полезно при написании, поскольку черновики могут содержать конфиденциальную информацию или непреднамеренные выражения. Встроенный ИИ сохраняет исходный и сгенерированный контент локально, а не отправляет его на сервер, что может повысить безопасность и защитить конфиденциальность контента.
Экономия средств
Одним из главных преимуществ использования встроенного ИИ является то, что браузер включает Gemini Nano, а API-интерфейсы бесплатны для использования. Никаких дополнительных или скрытых затрат.
Встроенный ИИ значительно снижает затраты на сервер и может полностью устранить затраты, связанные с выводом ИИ. Это решение может быть быстро масштабировано для большой базы пользователей и позволяет пользователям отправлять последовательные запросы для уточнения результатов без дополнительных сборов.
Оперативность и надежность
Встроенный ИИ обеспечивает стабильное и быстрое время отклика, независимо от условий сети. Это позволило пользователям снова и снова генерировать контент, что значительно облегчает пользователям возможность пробовать новые идеи и быстро создавать удовлетворяющий конечный результат.
Простота разработки
Встроенный в Chrome ИИ упрощает процесс разработки, предоставляя легкодоступный API. Разработчики получают выгоду от того, насколько легко создавать функции на базе ИИ для своих приложений.
Gemini Nano и встроенные API AI устанавливаются в Chrome, поэтому нет необходимости в дополнительной настройке или управлении моделями. API используют JavaScript, как и другие API браузера, и не требуют экспертных знаний в области машинного обучения.
Преодоление трудностей для достижения лучших результатов
Опыт CyberAgent в работе с API Prompt позволил получить ценные уроки о нюансах работы с LLM на стороне клиента.
- Непоследовательные ответы : Как и другие LLM, Gemini Nano не гарантирует идентичные выходные данные для одного и того же запроса. CyberAgent обнаружил ответы в неожиданных форматах (таких как Markdown и недопустимый JSON). Даже при наличии инструкций результаты могут сильно различаться. При реализации любого приложения или расширения Chrome со встроенным ИИ может быть полезно добавить обходной путь, чтобы гарантировать, что выходные данные всегда будут в правильном формате.
- Лимит токенов : Управление использованием токенов имеет решающее значение. CyberAgent использовал такие свойства и методы, как
inputUsage
,inputQuota
иmeasureInputUsage()
для управления сеансами , поддержания контекста и сокращения потребления токенов. Это было особенно важно при уточнении названий. - Ограничения по размеру модели : поскольку модель загружается и находится на устройстве пользователя, она значительно меньше, чем серверная модель. Это означает, что крайне важно предоставить достаточный контекст в подсказке для достижения удовлетворительных результатов, особенно для резюмирования. Узнайте больше о понимании размеров LLM .
CyberAgent подчеркивает, что, хотя клиентские модели пока не доступны повсеместно во всех браузерах и устройствах, а у меньших моделей есть ограничения, он все равно может обеспечить впечатляющую производительность для определенных задач. Возможность быстрой итерации и экспериментирования без серверных затрат делает его ценным инструментом.
Они советуют найти баланс, признавая, что идеальных ответов трудно достичь с любым ИИ, будь то серверный или клиентский. Наконец, они видят будущее, в котором гибридный подход, объединяющий сильные стороны как серверного, так и клиентского ИИ, раскроет еще больший потенциал.
Взгляд вперед
Исследование CyberAgent встроенного ИИ демонстрирует захватывающие возможности бесшовной интеграции ИИ для улучшения пользовательского опыта. Их расширение, созданное для работы с Ameba Blog, демонстрирует, как эти технологии могут быть практически применены для решения реальных проблем, предлагая ценные уроки для более широкого сообщества веб-разработчиков.
По мере развития технологий и расширения поддержки браузеров и устройств мы ожидаем увидеть еще больше инновационных приложений встроенного ИИ и других форм клиентского ИИ.
Ресурсы
- Узнайте больше о Prompt API
- Начните использовать встроенные API в Chrome
- Исследование CyberAgent по веб-ИИ , которое охватывает ту же тему.
- Смотреть Будущее ИИ уже наступило , примеры использования ИИ на стороне клиента от CyberAgent
Благодарности
Спасибо блогерам Ameba, ao , Nodoka , Erin , Chiaki и socchi , которые дали обратную связь и помогли улучшить расширение. Спасибо Thomas Steiner , Alexandra Klepper и Sebastian Benz за помощь в написании и рецензировании этого поста в блоге.