Stack production-ready
- Backend : FastAPI (Python) ou Node.js + LangChain.js
- Frontend : Next.js + React + ai-sdk Vercel
- Vector DB : Pinecone (managed) ou Postgres+pgvector (self)
- Cache LLM : Redis pour économiser les coûts
- Monitoring : LangSmith (gratuit) ou Helicone
- Auth : NextAuth ou Clerk
- Hosting : Vercel (front) + Render/Railway (backend)
Coûts à anticiper
- API Claude Sonnet 4 : 3 USD/million tokens input + 15 USD/million output
- Embedding text-3-small : 0.02 USD/million tokens
- Pinecone serverless : 70 USD/mois pour 5M vectors
- Vercel + Render : 50 USD/mois total
- Total pour MVP avec 100 users actifs : ~150-300 USD/mois
💡 Conseil ROI : commence par Claude Haiku (5x moins cher que Sonnet) pour 80% des cas, et bascule sur Sonnet/Opus pour les cas complexes.