Создавайте SDG-конвейеры для питания разговорного ИИ, бенчмарков и агентских рабочих процессов с помощью инструментов синтетических данных NVIDIA NeMo.

Перейти на сайт
0 голосов
0 комментариев
0 сохранений

Вы владелец этого сервиса?

Подайте заявку чтобы публиковать обновления, новости и отвечать пользователям.

Войдите в аккаунт чтобы подать заявку

Войти
Полностью бесплатно / от ~$10/мес (по объёму)
Рейтинг доверия
686 /1000 high
✓ online

Описание

Gretel — это комплексная платформа синтетических данных, предназначенная для генерации высококачественных, сохраняющих приватность синтетических наборов данных, которые имитируют статистические свойства реальных данных, удаляя при этом конфиденциальную информацию. Её основное ценностное предложение заключается в обеспечении безопасного обмена данными, их дополнения и обучения моделей ИИ без ущерба для конфиденциальности или соответствия нормам, тем самым ускоряя разработку и исследования в регулируемых отраслях. Платформа сочетает передовые генеративные модели с надёжными фильтрами приватности для создания безопасных и полезных данных для широкого спектра приложений.

Ключевые возможности: Платформа предлагает набор инструментов, включая генераторы синтетических данных с использованием моделей, таких как GPT и дифференциальная приватность, API для преобразования и классификации данных, а также метрики качества для оценки достоверности синтетических данных. Например, пользователи могут генерировать синтетические записи о транзакциях клиентов для обучения моделей обнаружения мошенничества или создавать синтетические медицинские записи пациентов для исследований без раскрытия реальной PHI. Она предоставляет автоматизированные фильтры приватности, такие как обнаружение и редактирование PII, и интегрирует рабочие процессы синтетических данных непосредственно в конвейеры данных.

Уникальность Gretel заключается в подходе, ориентированном на разработчиков, с полнофункциональным API и SDK, что позволяет легко интегрировать платформу в существующие рабочие процессы MLOps и data science. Она поддерживает как облачные, так и локальные развёртывания, предлагая больший контроль для предприятий со строгими требованиями к суверенитету данных. Технически платформа использует передовые технологии генеративного ИИ, включая сотрудничество с такими фреймворками, как NVIDIA NeMo, для создания высокореалистичных табличных, временных рядов и текстовых данных. Её фокус на измеримых гарантиях приватности, таких как бюджеты дифференциальной приватности, обеспечивает проверяемое соответствие нормам, что является ключевым отличием в таких областях, как здравоохранение и финансы.

Идеально подходит для специалистов по данным, исследователей ИИ и разработчиков в строго регулируемых секторах, таких как здравоохранение, финансы и государственный сектор, которым необходимо обмениваться или использовать данные в соответствии с GDPR, HIPAA или CCPA. Конкретные варианты использования включают создание синтетических наборов данных для обучения диалоговых ИИ-агентов, тестирования моделей машинного обучения, дополнения недостаточных обучающих данных и обеспечения безопасного сотрудничества между организациями или внутренними командами. Также платформа ценна для команд ИТ-безопасности и офицеров по защите данных, ответственных за снижение рисков в аналитике данных и инициативах ИИ.

Модель ценообразования — freemium с щедрым бесплатным тарифом для изучения и прототипирования. Платные тарифы основаны на использовании и масштабируются в зависимости от объёма синтезированных и обработанных данных, что делает платформу доступной для отдельных проектов и поддерживает крупные корпоративные развёртывания с индивидуальным ценообразованием для высоких объёмов.

686/1000
Trust Rating
high