Google Cloud опубликовала эталонную архитектуру приватных соединений для приложений RAG

robot
Генерация тезисов в процессе

ME News, сообщение от 5 апреля (UTC+8): в последнее время Google Cloud опубликовал техническую статью, в которой представлена частная эталонная архитектура, предназначенная для проектирования генеративных AI-приложений с возможностями извлечения с усилением (RAG). Эта архитектура подходит для сценариев, где межсистемный обмен данными должен использовать частные IP-адреса и не может проходить через публичный интернет. В основе дизайна лежит региональная модель: она включает внешнюю сеть и среду Google Cloud, которая, в свою очередь, состоит из проекта маршрутизации, проекта хостов Shared VPC и трех выделенных сервисных проектов. Архитектура включает ключевые сервисы, такие как Cloud Interconnect/Cloud VPN, Network Connectivity Center, Cloud Router, Private Service Connect, Shared VPC, Cloud Armor, Application Load Balancer и VPC Service Controls. В статье подробно описаны три ключевых пути трафика: поток заполнения RAG-данными, поток инференса (вывода) и поток управления и маршрутизации; цель — обеспечить предприятиям AI-нагрузки безопасную и надежную инфраструктуру за счет сквозного частного подключения и многоуровневого контроля безопасности. (Источник: InFoQ)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить