Semantara
Español
Iniciar sesión

Preguntas frecuentes

Lo esencial sobre cómo funciona Semantara, cómo te ahorra dinero y cómo protege tus llaves y tus datos.

¿Qué es Semantara y qué problema resuelve?

Semantara es un proxy inteligente que se coloca entre tu aplicación y los proveedores de IA (OpenAI, Anthropic y pronto Gemini). Añade caché semántica, ruteo por complejidad y control de gasto para que pagues menos por las mismas respuestas, sin cambiar tu código.

¿Qué significa BYOK ("trae tu propia llave")?

Que usas tus propias llaves de los proveedores. Semantara nunca revende tokens ni te cobra sobreprecio por el consumo: tú mantienes tu relación de facturación con OpenAI/Anthropic y nosotros solo cobramos la suscripción de la plataforma.

¿Cómo me ahorra dinero la caché semántica?

Cuando dos preguntas significan lo mismo aunque estén escritas distinto, Semantara reutiliza la respuesta ya generada en vez de volver a llamar (y pagar) al modelo. En cargas reales, entre el 30% y el 40% de las consultas son semánticamente similares, lo que suele traducirse en 40-70% menos de costo en esas consultas.

¿En qué se diferencia de la caché de OpenAI o Anthropic?

Los proveedores cachean prefijos idénticos (mismo texto exacto). Semantara cachea por significado: "¿cómo reinicio mi contraseña?" y "olvidé mi clave, ¿qué hago?" comparten respuesta. Además, Semantara se apila sobre la caché del proveedor, no la reemplaza.

¿Qué es el ruteo por complejidad?

Semantara clasifica cada petición y la envía al modelo más adecuado: las simples a un modelo más barato y rápido, las complejas al modelo potente. Pagas el modelo premium solo cuando de verdad hace falta.

¿Tengo que cambiar mi código para integrarlo?

No. Semantara expone un endpoint compatible con OpenAI (/v1/chat/completions). Cambias la URL base (y opcionalmente el modelo) y listo; el resto de tu integración sigue igual.

¿Qué proveedores soporta?

Hoy OpenAI y Anthropic, con Gemini en camino. Al ser compatible con el estándar de OpenAI, puedes unificar varios proveedores detrás de una sola integración.

¿Mis llaves y mis datos están seguros?

Sí. Las llaves de proveedor se cifran con AES-256-GCM, cada cliente está aislado en un entorno multi-tenant y nunca usamos tus datos para entrenar modelos. Más detalle en la página de Seguridad.

¿Cuánto puedo ahorrar realmente?

Depende de cuántas consultas se repiten y de tu mezcla de modelos. Usa la Calculadora de ahorro para estimar tu caso; el ahorro típico en consultas repetidas va del 40% al 70%.

¿Puedo controlar mi gasto?

Sí. Sigues tu consumo y tu ahorro en tiempo real desde el panel —el costo se calcula en cada petición, por cliente y por llave—, con nuestra métrica central: dólares ahorrados al mes. Y defines límites de tasa por llave para frenar consumos inesperados.

¿Cómo funcionan los planes y la facturación?

Hay un plan Free, Pro y Business con precios fijos, y Enterprise a medida. Como es BYOK, la suscripción cubre la plataforma; el consumo de los modelos lo pagas directo a tus proveedores. Mira la página de Planes.

¿Dónde se aloja? ¿Hay opción on-premise?

La versión gestionada corre en infraestructura cloud. Para necesidades corporativas con datos sensibles, escríbenos: el plan Enterprise contempla despliegues a medida.