Арендуйте удалённый CUDA‑узел для инференса ONNX‑моделей. Подключение через HTTPS — без установки драйверов на ваш сервер.
Инференс выполняется на CUDA‑узлах, доступ к которым идёт через это API.
Передайте ссылку на модель и входы — результат вернётся в API.
Один раз загрузите модель и вызывайте инференс многократно.
Полное описание методов, форматов запросов и примеров — в Swagger. Доступ по API‑ключу выдаётся после заявки.