AIFinder

Comparadores IA

Chatbot Arena

Chatbot Arena

Comparador crowdsourced de LLMs

Hugging Face Leaderboard

Hugging Face Leaderboard

Ranking de modelos por tareas y datasets

Papers with Code

Papers with Code

Benchmarks académicos

OpenRouter Leaderboard + Pricing

OpenRouter Leaderboard + Pricing

Comparativa de modelos y precios

Zeno AI

Zeno AI

Evaluación y depuración de modelos

Stanford HELM

Stanford HELM

Evaluación académica con métricas

Costos & Tokens

OpenAI Pricing Calculator

OpenAI Pricing Calculator

Calcula costes por tokens y modelos de OpenAI

OpenAI Tokenizer

OpenAI Tokenizer

Cuenta tokens de un texto antes de enviarlo

Anthropic Token Counting

Anthropic Token Counting

Cuenta tokens para prompts y mensajes en Claude

Google AI Studio Token Estimator

Google AI Studio Token Estimator

Estima tokens y costes para modelos de Google

Replicate Cost Calculator

Replicate Cost Calculator

Calcula el coste de inferencia en Replicate

RunPod Pricing Estimator

RunPod Pricing Estimator

Estima coste de uso de GPU en RunPod

Suno Cost Calculator

Suno Cost Calculator

Estimador de costes para generación de audio (no

ElevenLabs Cost Estimator

ElevenLabs Cost Estimator

Estimador de costes para TTS en ElevenLabs

Prompts IA

FlowGPT

FlowGPT

Comunidad con prompts listos

PromptPerfect

PromptPerfect

Optimización automática de prompts

AIPRM

AIPRM

Catálogo de prompts por categorías

PromptBase

PromptBase

Marketplace de prompts

PromptHero

PromptHero

Biblioteca visual de prompts

Jasper Prompt Generator

Jasper Prompt Generator

Generador de prompts para marketing

ChatX Prompt Generator

ChatX Prompt Generator

Prompts a partir de objetivos

PromptHub

PromptHub

Gestor y repositorio de prompts

Promptist

Promptist

Asistente de prompts

prompts.chat

prompts.chat

Directorio de prompts y UX para copiar/editar

Evaluación IA

TruLens

TruLens

Evalúa respuestas de LLMs

Helicone

Helicone

Métricas y feedback de modelos

PromptLayer

PromptLayer

Análisis de prompts en producción

Arize AI

Arize AI

Evaluación de precisión y sesgo

Humanloop

Humanloop

Testing de prompts y outputs

LM Evaluation Harness

LM Evaluation Harness

Framework de evaluación LLMs

Genei Evaluator

Genei Evaluator

Evalúa resúmenes y respuestas

LangSmith

LangSmith

Trazabilidad y evaluaciones

Langfuse

Langfuse

Tracing y métricas para LLMs

Ragas

Ragas

Evaluación para RAG

DeepEval

DeepEval

Asserts y test de calidad

Giskard

Giskard

Testing y QA de modelos